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并 行 计算 的 广泛 采用 和 现今 应 用 问题 的 日 趋 复杂 ， 使 得 并 行 算法 的 设计 和 分 析 日 益 引起 
人 们 的 兴趣 。 这 本 书 满足 了 并 行 算法 的 入 门 者 ， 特 别 是 计算 机 科学 、 数 学 和 工程 专业 的 大 学 
生 的 需求 。 本 书 系统 地 讲述 最 新 的 设计 技术 ， 并 对 所 描述 的 每 一 个 算法 提供 分 析 和 详细 的 实 
现 细节 。 它 的 主要 内 容 包 括 并 行 计算 的 基础 ， 树 和 图 的 并 行 算法 ， 排 序 、 搜 索 和 合并 的 并 行 
算法 以 及 数值 算法 等 。 本 书 的 特色 在 于 : 


@ 用 清晰 简单 的 术语 讲述 基本 的 概念 

@ 提供 大 量 的 例子 加 强 学 生 的 理解 

® 展示 怎样 为 计算 机 科学 、 数 学 和 工程 的 典型 问题 开发 并 行 算法 
@ 对 新 的 设计 技术 作 扩 展 性 的 阐述 

@ 在 PRAM 模 型 环境 中 讨论 并 行 算法 

@ 在 章节 后 面 附 有 大 量 的 习题 和 关于 并 行 计算 的 参考 文献 





Ee Yawi r 执教 于 印度 Palayamkottai 圣 Xavier 学 院 的 计算 机 科学 系 。 他 在 并 行 算法 领域 
者 全 V1CI 已 经 发 表 了 大 量 的 论文 并 出 版 了 十 多 部 计算 机 科学 教材 . 


四 是 美国 路 易 斯 安 那州 立 大 学 计算 机 科学 系 的 教授 和 系 主任 。 他 已 在 高 性 

介 S.S. Ye ga 能生 法 和 数据 结构 领 域 发 表 了 220 多 简 论 文 和 数 部 专 苦 。 阐 久 导 过 美国 
海军 研究 局 [ONR)， 国 家 航空 航天 管理 局 (NASA)、 国 家 科学 基金 会 (NSF) 和 其 他 机 构 的 研究 项 目 。 
他 因为 在 数据 结构 和 算法 领域 内 的 贡献 而 成 为 IEEE 的 高 级 会 员 ， 并 获得 大 学 杰出 教员 奖 。 
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本 书 对 并 行 算法 作 了 入 门 级 的 介绍 ， 用 四 部 分 讲解 并 行 算法 的 设计 过 程 和 最 新 的 设 
计 方 法 ， 并 对 书 中 所 描述 的 每 一 个 算法 提供 分 析 和 详细 的 实现 细节 。 全 书包 括 并 行 计算 
的 基础 ， 树 和 图 的 并 行 算法 ， 排 序 、 搜 索 和 合并 的 并 行 算法 及 数值 算法 等 内 容 。 其 中 重 
点 强调 了 图 模型 算法 。 在 章节 后 面 附 有 大 量 的 习题 和 关于 并 行 计算 的 参考 文献 。 

本 书 可 以 作为 大 学 计算 机 科学 与 工程 专业 高 年 级 学 生 的 并 行 算法 课 教材 。 对 于 计算 
机 科学 、 数 学 和 工程 领域 的 研究 生 、 科 研 工作 者 和 工程 师 ， 也 是 一 本 不 可 多 得 的 参考 书 。 


C.Xavier, S.S.Iyengar: Introduction to Parallel Algorithms (ISBN: 0-471-25182-8) 

Authorized translation from the English language edition published by John Wiley & 
Sons, Inc. 

Copyright © 1998 by John Wiley & Sons, Inc. 


All rights reserved. 


本 书 中 文 简体 字 版 由 约翰 - 威 利 父子 公司 授权 机 械 工 业 出 版 社 和 中 信 出 版 社会 作出 
版 。 未 经 出 版 者 书面 许可 ， 不 得 以 任何 方式 复制 或 抄袭 本 书 内 容 。 
版 权 所 有 ， 侵 权 必 究 。 
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图 书 在 版 编目 (CIP) 数据 


并 行 算法 导论 / ( 印 ) 艾 克 萨 威 尔 《(Xavier, C.)，( 美 ) 依 思 加 尔 (Iyengar, S. S.) 
著 ; 张云泉 ， 陈 英 译 . -北京 : 机 械 工 业 出 版 社 ，2004.2 
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书 名 原文 : Introduction to Parallel Algorithms 

ISBN 7-111-13390-0 
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出 版 者 的 话 


文艺 复兴 以降， 源远流长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 区 断 性 的 优势 ; 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 璧 
划 了 研究 的 范畴 ， 还 揭 亲 了 学 术 的 源 变 ， 既 遵循 学 术 规范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ,也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国 家 
在 其 计算 机 科学 发 展 的 几 十 年 间 积 淀 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 
设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工业 出 版 社 华章 图 文 信息 有 限 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”。 自 1998 年 开始 ， 
华章 公司 就 将 工作 重点 放 在 了 遵 选 、 移 译 国 外 优秀 教材 上。 经 过 几 年 的 不 懈 努 力 ， 我 们 与 
Prentice Hall，Addison-Wesley ，McGraw-Hill ，Morgan Kaufmann 等 世界 著名 出 版 公司 建立 了 
良好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 甄选 出 Tanenbaum ，Stroustrup ，Kernighan ， 
Jim Gray 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 度 藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 从 书 的 品位 和 格调 。 

“计算 机 科学 从 书 ” 的 出 版 工作 得 到 了 国内 外 学 者 的 虚 力 襄 助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专 诚 为 其 书 的 中 译本 作 序 。 迄 今 , “计算 机 科学 丛书 ”已 经 出 版 了 近 百 个 
品种 ， 这 些 书 籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采用 为 正式 教材 和 参考 书籍 ， 为 
进一步 推广 与 发 展 打下 了 坚实 的 基础 。 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 和 人 一 个 新 的 阶段 。 为 此 ， 华 章 公司 将 加 大 引进 教材 的 力度 ， 在 “华章 教育 ”的 总 规划 
之 下 出 版 三 个 系列 的 计算 机 教材 : 除 “ 计 算 机 科学 丛书 ”之 外 ， 对 影印 版 的 教材 ， 则 单独 开 
辟 出 “经 典 原版 书库 ”;， 同时 ， 引 进 全 美 通行 的 教学 辅导 书 “Schaum's Outlines ”系列 组 成 
“全 美 经 典 学 习 指 导 系 列 ”。 为 了 保证 这 三 套 从 书 的 权威 性 ， 同 时 也 为 了 更 好 地 为 学 校 和 老师 
们 服务 ， 华 章 公司 聘 请 了 中 国 科 学 院 、 北 京 大 学 、 清 华 大 学 、 国 防 科技 大 学 、 复 旦 大 学 、 上 
海 交通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科技 大 学 、 哈 尔 滨 工业 大 学 、 西 安 交通 大 学 、 中 国 
人 民 大 学 、 北 京 航空 航天 大 学 、 北 京 邮电 大 学 、 中 山大 学 、 解 放 军 理工 大 学 、 郑 州 大 学 、 湖 
北 工学 院 、 中 国 国 家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计算 机 的 各 个 领域 
的 著名 学 者 组 成 “专家 指导 委员 会 ”， 为 我 们 提供 选 题 意 见 和 出 版 监督 。 

这 三 套 丛 书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 





TV 


的 教学 度 身 订 造 的 。 其 中 许多 教材 均 已 为 M. I.T.，Stanford ，U.C. Berkeley ，C. M. U. 等 世界 
名 牌 大 学 所 采用 。 不 仅 涵盖 了 程序 设计 、 数 据 结构 、 操 作 系 统 、 计 算 机 体系 结构 、 数 据 库 、 
编译 原理 、 软 件 工程 、 图 形 学 、 通 信 与 网 络 、 离 散 数 学 等 国内 大 学 计算 机 专业 普遍 开设 的 核 
心 课程 ， 而 且 各 具 特 色 一 一 有 的 出 自 语言 设计 者 之 手 、 有 的 历经 三 十 年 而 不 豪 、 有 的 已 被 全 
世界 的 几 百 所 高 校 采用 。 在 这 些 圆 熟 通 博 的 名 师 大 作 的 指引 之 下 ， 读 者 必 将 在 计算 机 科学 的 
宫殿 中 由 登 堂 而 入 室 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因 素 使 我 们 的 
图 书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 
的 重要 帮助 。 教 材 的 出 版 只 是 我 们 的 后 续 服 务 的 起 点 。 华 章 公司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


电子 邮件 : hzedu@hzbook.com 

联系 电话 : (010 ) 68995264 

联系 地 址 ; 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 : 100037 
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译 者 序 


近年 来 ， 随 着 社会 众多 行业 信息 化 带 来 的 对 计算 机 信息 处 理 能 力 和 计算 能 力 需 求 的 不 断 
提高 ， 以 及 高 性 能 计算 机 特别 是 高 性 能 机 群 系统 的 普及 和 发 展 ， 并 行 计算 机 越 来 越 多 地 开始 
被 广大 普通 计算 机 专业 人 员 以 及 其 他 专业 的 人 员 使 用 。 然 而 ， 仅 仅 有 并 行 计 算 机 的 硬件 平台 
是 不 够 的 ， 还 需要 有 配套 的 能 充分 发 挥 机 器 性 能 的 并 行 计算 应 用 软件 。 广 大 并 行 计算 机 用 户 
_ 和 相关 专业 的 学 生 人 迫切 需要 了 解 并 行 算法 设计 和 分 析 的 基础 知识 。 我 们 翻译 此 书 的 目的 是 推 
动 高 性 能 计算 在 中 国 的 进一步 普及 和 发 展 ， 尤 其 是 在 高 等 院 校 中 的 普及 和 发 展 。 

本 书 的 两 位 作者 C. Xavier 博士 和 S.S. Iyengar 博 士 都 是 多 年 从 事 并 行 算法 设计 研究 的 资深 
教授 ， 有 多 年 的 教学 经 验 ， 并 发 表 了 大 量 的 学 术 论 文 ， 出 版 了 多 部 学 术 专 著 。 其 中 Iyengar 博 
士 是 IEEE 的 高 级 成 员 和 IEEE 计 算 机 协会 杰出 访问 者 (1995 ~ 1998 年 )， 由 于 其 对 图 像 处 理 数 
据 结 构 和 算法 以 及 传感器 融合 (sensor fusing) 问题 的 杰出 贡献 而 于 1997 年 获得 著名 的 IEEE 技 
术 成 就 奖 。 

本 书 分 四 个 部 分 介绍 共享 存储 器 计算 模型 PRAM 下 的 并 行 算 法 设计 ， 第 一 部 分 介绍 并 行 
计算 、 并 行 计算 机 和 并 行 算法 设计 的 基本 概念 ， 并 行 计算 机 分 类 、 共 享 存储 器 并 行 计算 模型 、 
并 行 算法 设计 中 的 数据 结构 和 并 行 算法 常用 设计 环境 ,以 及 几 个 简单 的 并 行 算法 ; 第 二 部 分 
首先 介绍 图 的 基本 概念 ， 随 后 介绍 树 算法 、 图 算法 和 屁 图 的 NC 算法 ， 以 及 相关 的 并 行 算法 ; 
第 三 部 分 介绍 搜索 与 合并 、 排 序 等 数组 处 理 并 行 算法 ; 第 四 部 分 介绍 有 关 数 值 计 算 的 并 行 算 
法 ， 包 括 线性 代数 方程 组 求解 并 行 算法 ， 以 及 微分 、 积 分 、 插 值 和 偏 微分 方程 求解 的 并 行 算 
法 。 

本 书 的 翻译 工作 由 张云泉 组 织 ， 并 翻译 第 0 ~ 1 章 、 第 2 章 第 1，2 节 、 第 3 ~ 4 章 、 第 8 ~ 9 章 、 
第 10 章 第 1，2，3 节 及 相应 各 章 习题 和 习题 答案 。 陈 英 翻 译 第 2 章 第 3 节 ， 第 5 ~ 7 章 、 第 10 章 第 
4~8 节 、 第 11 ~ 12 章 及 相应 各 章 习 题 。 
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前 言 


最 近 几 年 ， 人 们 学 习 、 设 计 和 分 析 并 行 算法 的 兴趣 日 浙 浓厚 。 这 部 分 是 由 于 用 新 技术 制 
造 的 计算 机 使 得 运算 成 本 比较 合理 ， 主 要 还 是 由 于 对 信息 处 理 能 力 的 需求 日 益 复杂 。 本 书 用 
四 部 分 讲解 并 行 算法 的 设计 : 第 一 部 分 给 出 并 行 算法 设计 的 基础 概念 。 其 中 对 流水 线 、 多 处 
理 、 分 时 和 共享 存储 器 模型 进行 重点 介绍 。 由 于 数据 结构 是 并 行 算法 设计 很 重要 的 组 成 部 分 ， 
本 书 专门 用 一 章 进行 介绍 。 基 于 信息 处 理 的 重要 性 ， 在 本 书 中 重点 强调 图 模型 算法 。 对 并 行 
算法 设计 中 重要 的 环境 则 给 出 大 量 的 例子 进行 解释 。 

本 书 第 二 部 分 介绍 图 理论 问题 常用 的 并 行 算法 。 对 各 种 图 问题 进行 研究 ， 并 给 出 相应 的 
并 行 算 法 。 专 门 用 一 章 对 张 图 进行 讲解 ， 其 中 主要 介绍 张 图 判别 算法 和 一 些 优化 问题 算法 。 
第 三 部 分 介绍 对 数组 进行 处 理 的 算法 ， 并 用 两 章 对 排序 、 搜 索 与 合并 算法 进行 介绍 。 

第 四 部 分 对 数值 计算 的 并 行 算法 进行 介绍 。 其 中 用 一 章 介 绍 代数 方程 并 行 算 法 。 详 细 给 
出 了 微分 、 积 分 和 微分 方程 (包括 偏 微分 方程 ) 的 相关 算法 。 另 外 还 对 内 插值 和 外 插值 并 行 
算法 进行 了 介绍 。 。 

本 书 的 显著 特色 是 : 

。 用 详细 的 例子 一 步 一 步 讲 解 并 行 算法 的 设计 ; 

。 详 尽 的 并 行 算法 分 析 与 实现 ; 

。 用 大 量 的 实例 对 每 一 个 概念 进行 解释 ; 

。 每 一 章 都 在 最 后 给 出 了 参考 文献 。 

本 书 是 我 们 两 位 共同 合作 的 结果 ， 对 本 书 内 容 负 有 同等 责任 。 我 们 欢迎 并 感谢 读者 提出 
评价 和 意见 。 
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第 0 章 引言 


0.1 计算 机 简介 


并 行 计算 在 诸如 图 像 处 理 、 机 器 人 学 等 许多 计算 密集 的 应 用 领域 是 重要 的 核心 问题 。 给 
定 一 个 问题 ， 并 行 计算 就 是 这 样 的 过 程 : 把 问题 分 解 成 子 问题 ， 同 时 计算 子 问 题 ， 最 后 把 子 
问题 的 解 合并 得 到 原 问 题 的 解 。 本 书 试图 给 出 各 种 不 同 问题 的 并 行 算法 设计 的 课程 材料 。 

当 汉 . 诺 依 曼 第 一 次 提出 计算 机 体系 结构 的 时 候 ， 他 把 计算 机 看 成 一 个 快速 计算 设备 。 
他 提出 了 计算 机 系统 的 五 大 组 成 部 分 : 

1. 输入 单元 ; 

2. 输出 单元 ; 

3. 存储 单元 ; 

4. 算术 逻辑 单元 ; 

5. 控制 单元 。 

图 0-1 中 给 出 该 体系 结构 的 框图 。 控 制 单元 控制 整个 系统 。 为 了 与 数据 线 相 区 别 ， 图 中 的 
控制 线 用 虚线 表示 。 输 入 单元 负责 使 计算 机 获取 输入 。 穿 孔 卡 片 、 穿 孔 纸 带 、 磁 带 、 磁 盘 和 
键盘 等 都 是 计算 机 历史 上 用 过 的 一 些 输入 设备 。 输 出 单元 负责 计算 机 的 输出 。 打 印 机 和 绘图 
仪 等 是 流行 的 输出 设备 。 在 过 去 四 十 年 左右 的 时 间 里 ， 主 要 由 于 快速 电子 部 件 的 采用 ， 计 算 
机 的 计算 速度 获得 了 极 大 的 提高 。 存 储 单元 和 算术 逻辑 单元 最 早 是 用 半导体 器 件 制 成 的 。 

电子 工业 的 发 展 帮助 设计 者 制造 更 快 的 计算 机 。 当 电子 工业 开发 出 晶体 管 时 ， 计 算 机 工 区 
业 就 用 晶体 管制 造 计算 机 。 





图 0-1 汉 ' 诺 依 曼 计算 机 体系 结构 框图 
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在 20 世 纪 60 年 代 后 期 ， 集 成 电路 的 概念 在 电子 工业 中 成 为 现实 。 这 使 得 制造 包含 几 百 个 
晶体 管 的 一 厘米 小 芯片 成 为 可 能 。 这 使 得 我 们 能 够 制造 出 体积 更 小 、 存 储 容量 更 大 和 速度 更 
快 的 计算 机 。 在 上 述 三 个 阶段 制造 的 计算 机 分 别称 为 第 一 代 、 第 二 代 和 第 三 代 计算 机 。 

在 20 世 纪 70 年 代 早期 ， 随 着 超大 规模 信 成 电路 (VLSI) 技术 的 诞生 ， 电 路 集成 技术 取得 
了 巨大 进展 。1971 年 由 Intel 公 司 实验 室 的 Ted Hoff 发 明 的 微 处 理 器 是 VLSI 技 术 的 主要 突破 。 
利用 微 处 理 器 设计 的 计算 机 称 作 微 型 计算 机 。 微 型 计算 机 和 其 他 用 VLSI 技 术 制 造 的 计算 机 称 
作 第 四 代 计 算 机 。 表 0-1 给 出 一 些 早期 微 处 理 器 的 详细 情况 。 


表 0-1 一 些 早期 微 处 理 器 


微 处 理 器 发 布 年 份 。 芯片 中 部 件数 速 度 意 义 


Intel 4004 1971 2 250 11 毫 秒 完成 两 个 4 位 数 相 加 第 一 个 微 处 理 器 
Intel 8080 1974 4 500 2.5 微 秒 完成 两 个 8 位 数 相 加 第 一 个 用 于 制造 通用 计算 
机 的 微 处 理 器 
Mostech (金属 1975 4 300 1 微 秒 完成 两 个 8 位 数 相 加 用 于 家 用 电脑 
氧化 半导体 6502) 
Motorola 68000 1979 70 000 3.2 微 秒 完成 两 个 16 位 数 的 相 乘 内 建 乘 积 电路 
HP Super Chip 1981 450 000 1.8 微 秒 完 成 两 个 32 位 数 的 相 乘 第 一 个 32 位 微 处 理 器 


1974 年 ，MIT 的 Ed Roberts 制 造 了 他 称 为 4ltair 的 微型 计算 机 。 这 就 是 第 一 台 个 人 计算 机 。 
随后 Apple Macintosh 和 IBM PC 进入 市 场 。 它 们 在 处 理 数据 方面 非常 快速 和 有 效 。Intel 的 486 
DX2 具 有 惊人 的 66MHz 的 速度 。32 位 处 理 器 帮 腾 (Pentium ) 由 于 其 重新 设计 的 浮 点 运算 单元 ， 
声称 在 数学 运算 密集 的 应 用 中 可 以 发 挥 出 两 倍 于 Intel 486 DX2 的 速度 。 最近 ，133MHz 的 奔腾 
处 理 器 也 已 经 发 布 。Pentium Pro 是 Intel 公 司 发 布 的 更 先进 的 微 处 理 器 。 另 外 一 个 公司 Alpha 也 
发 布 了 主 频 为 400MHz 的 微 处 理 器 。 一 个 日 本 的 科学 家 小 组 认为 对 于 满足 未 来 社会 人 工 智 能 领 
域 的 计算 需求 而 言 ， 目 前 的 计算 机 体系 结构 是 不 适宜 的 。1979 年 ， 日 本 政府 任命 由 Tohru 
Moto Oka 领 导 一 个 委员 会 对 20 世 纪 90 年 代 的 计算 机 需求 进行 预测 。 该 委员 会 下 设 三 个 小 组 委 
员 会 。 由 Hajime Karatsu 领 导 的 第 一 个 小 组 委员 会 有 10 个 成 员 ， 研 究 未 来 需要 的 计算 机 类 型 ; 
由 Hideo Aiso 领 导 的 第 二 个 小 组 委员 会 有 12 个 成 员 ， 研 究 未 来 需要 的 计算 机 体系 结构 ; 由 
Hazuhiro Fuchi 领 导 的 第 三 个 小 组 委员 会 有 13 个 成 员 ， 研 究 未 来 需要 的 计算 机 的 基本 概念 。 这 
三 个 小 组 委员 会 提交 了 他 们 的 建议 书 ， 并 由 主席 Oka 汇 总 成 对 未 来 计算 机 的 最 后 建议 书 ， 这 就 
是 后 来 所 谓 的 第 五 代 计 算 机 。 日 本 政府 同意 实施 第 五 代 计算 机 项 目 ， 并 在 1981 年 10 月 主办 了 
第 一 届 世 界 第 五 代 计 算 机 大 会 。 在 这 次 大 会 上 ， 详 细 讨论 了 第 五 代 计 算 机 建议 书 的 细节 ， 来 
自 世 界 各 地 参加 大 会 的 科学 家 接受 了 该 建议 书 。 当 第 五 代 计 算 机 进入 市 场 时 ， 现 有 的 计算 机 
不 会 变 得 毫 无 价值 。 对 于 解决 计算 领域 的 大 多 数 问题 ， 老 的 计算 机 仍然 有 用 。 第 五 代 计 算 机 
对 普通 的 应 用 程序 不 会 很 有 效 。 然 而 ， 它 们 可 以 用 于 信息 管理 ， 自 然 语 言 处 理 ， 语 音 、 文 字 
和 图 像 识 别 ， 以 及 其 他 人 工 智 能 应 用 领域 。 第 五 代 计 算 机 的 体系 结构 将 和 当前 的 色 ， 诺 依 曼 
计算 机 体系 结构 完全 不 同 。 日 本 政府 成 立 了 新 一 代 计 算 机 技术 研究 所 (ICOT) 来 建造 第 五 代 计 
算 机 。 

第 五 代 计 算 机 的 数据 和 指令 都 存放 在 计算 机 的 内 存 中 。 每 当 进 行 处 理 时 ， 从 内 存 中 取出 
数据 。 想 想 我 们 每 天 的 活动 ， 大 部 分 人 都 是 采用 类 似 的 过 程 。 

以 医生 为 病人 看病 为 例 ( 见 图 0-2)。 医 生 从 病人 那里 收集 症状 (数据 }。 而 他 已 经 知道 所 


由 
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有 的 病 和 其 相应 的 症状 ,这 些 都 存放 在 他 的 记忆 里 面 。 医 生 通过 比较 记忆 中 记录 的 数据 和 病 
人 的 症状 诊断 病症 。 





医生 


图 0-2 医学 诊断 

在 没有 医生 的 情况 下 ， 我 们 能 否 利 用 计算 机 呢 ? 也 就 是 说 计算 机 能 否 代替 医生 ? 科学 家 
们 已 经 接受 了 这 一 挑战 ， 试 图 研制 出 能 够 解决 这 一 问题 的 计算 机 。 这 类 应 用 需要 在 几 分 之 一 
秒 的 时 间 内 完成 大 量 的 处 理 操 作 。 这 些 问题 都 属于 人 工 智能 领域 。 用 于 解决 人 工 智能 问题 的 
计算 机 系统 就 是 专家 系统 。 下 列 是 人 工 智能 的 一 些 其 他 应 用 领域 : 

“自然 语言 处 理 (NLP); 

。 图 像 识 别 和 处 理 ; 

。 模 式 识别 ; 

。 字 符 识别 ; 

。 语 音 识别 ; 

。 天 气 预报 ; 

。 医 学 诊断 ; 

。 智 能 机 器 。 

自然 语言 处 理 以 英语 、 法 语 、 德 语 等 语言 的 语句 为 例 ， 人 能 够 理解 这 些 语言 并 且 采 取 相 
应 的 行动 。 根 据 上 下 文 的 不 同 ， 同 样 的 语句 可 以 有 不 同 的 含义 。 例 如 ， 考 察 句 子 L6] 

Joseph called his friend a taxi. 

这 是 说 Joseph 给 他 朋友 叫 了 一 辆 出 租车 呢 ， 还 是 他 用 “出 租车 - 作为 朋友 的 外 号 ?该 语句 
的 含义 取决 于 上 下 文 。 同 一 语句 可 以 有 不 同 的 含义 ， 不 同 的 语句 可 以 有 相同 的 含义 。 人 可 以 
根据 上 下 文理 解 这 些 语句 。 在 计算 机 中 存储 与 语言 上 下 文 无 关 的 文法 ， 并 把 它 用 于 语言 理解 
和 翻译 ， 就 是 自然 语言 处 理 (NLP)。 

图 像 识 别 和 处 理 各 国 发 射 的 人 造 卫 星 不 断 发 回 从 外 层 空 间 获得 的 地 球 图 片 。 通 过 分 析 这 
些 图 片 中 的 图 像 ， 可 以 发 现 天 气 变 化 、 识 别 森林 和 农业 区 域 等 。 图 像 处 理 的 另 一 个 有 趣 应 用 
是 通过 照片 识别 人 。 在 扫描 一 个 人 的 照片 之 后 ， 计 算 机 可 以 生成 这 个 人 的 图 像 ， 并 可 以 修改 
诸如 发 型 、 胡 须 或 旷 等 特征 。 这 种 应 用 对 警察 部 门 追捕 罪犯 有 巨大 作用 。 一 幅 图 像 通 常用 像 
素 的 矩阵 表示 。 每 个 像素 用 颜色 、 强 度 、 亮 度 等 数据 表示 。 在 特定 的 应 用 中 ， 一 幅 图 像 每 英 
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寸 可 以 有 14 400 个 像素 ， 并 要 转换 成 数字 数据 。 这 使 得 这 类 应 用 有 很 强 的 计算 强度 。 在 图 像 
的 实时 处 理 中 ， 整 体 的 响应 时 间 必 须 保 证 尽 可 能 短 。 因 此 ， 加 快 像素 处 理 的 速度 是 很 必要 的 。 

模式 /字符 识别 ”在 看 到 一 把 椅子 的 时 候 ， 我 们 能 够 认 出 它 是 一 把 椅子 。 为 什么 ?》 它 有 四 
条 腿 。 一 头 牛 也 有 四 条 腿 。 但 牛 不 是 椅子 。 即 使 椅子 断 了 一 条 腿 ， 我 们 仍然 可 以 认 出 它 是 椅 
子 。 我 们 用 一 种 直观 的 方法 来 识别 一 把 椅子 。 相 似 地 ， 计 算 机 可 以 被 教会 通过 视觉 来 识别 一 
把 椅子 ， 这 涉及 到 学 习 理 论 的 应 用 。 这 一 应 用 领域 在 计算 机 科学 中 称 为 模式 识别 。 

不 同 的 人 会 写 出 不 同 风格 的 字母 4， 但 人 们 仍然 能 够 识别 它 。 计 算 机 识别 手写 字体 的 能 力 
就 是 字符 识别 。 在 日 本 ， 当 第 一 台 能 够 识别 字符 的 计算 机 在 邮局 投入 到 邮件 分 捡 工作 中 时 ， 
其 识别 精度 为 90%。 当 Tokyo 被 误 拼 成 Tokey 的 时 候 ， 计 算 机 不 能 容忍 这 一 拼写 错误 ， 但 它 把 
Tokey 当 做 没有 编 入 其 城市 一 览 表 的 另外 一 个 城市 。 在 这 种 情况 下 ， 需 要 计算 机 有 一 定 的 容错 
能 力 。 为 了 提高 容错 能 力 ， 计 算 机 必须 提高 处 理 速度 。 从 第 一 次 应 用 邮件 分 捡 机 器 之 后 ， 又 
开展 了 大 量 的 改进 工作 ， 目 前 很 多 国家 都 在 使 用 这 种 系统 。 

在 字符 识别 过 程 中 ， 需 要 大 量 的 计算 。 一 个 手写 的 字符 首先 通过 摄像 机 扫描 成 高 清晰 度 
的 图 像 ， 例 如 每 英寸 14 400 个 像素 〈 见 图 0-3)。 图 像 的 颜色 、 光 的 强度 和 其 他 参数 转换 成 数字 
表示 。 把 该 数字 表示 与 字符 的 标准 数字 表示 《比如 4) 进行 比较 。 从 这 个 比较 中 ， 通 过 复杂 的 
过 程 ， 对 所 观察 到 的 字符 是 4 的 概率 进行 计算 。 对 于 所 观察 字符 为 B、C、… 的 概率 也 重复 同 
样 的 计算 过 程 。 最 后 比较 所 有 得 到 的 概率 ， 并 把 手写 字符 识别 成 概率 最 高 的 那 一 个 。 


摄像 机 
计算 机 


图 0-3 字符 识别 


从 上 面 的 讨论 中 可 以 明显 看 出 概率 的 计算 量 很 大 : 

{P (a) /a=4,B,cC,.} 

其 中 P (a) 代表 观察 到 的 字符 为 a 的 概率 。 对 于 这 类 应 用 ， 普 通 的 计算 机 是 不 能 胜任 的 。 

语音 识别 语音 识别 是 辨别 一 个 人 声音 的 能 力 。 人 们 能 够 轻松 识别 不 同 的 语音 模式 。 由 于 
任何 两 个 人 的 语音 都 不 同 ， 设 计 出 能 够 识别 语音 的 计算 机 程序 是 很 困难 的 任务 。 因 而 科学 家 
在 该 领域 还 没有 取得 太 多 进展 。 已 经 设计 出 的 计算 机 只 限于 能 够 识别 特定 人 而 不 是 任何 人 的 
语音 。 

天 气 预 报 天 气 预 报 是 通过 获得 大 量 的 数据 ， 如 温度 、 气 压 、 湿 度 等 ， 然 后 对 这 些 数 据 进 
行 复杂 的 数值 计算 而 得 出 的 。 这 些 复 杂 的 计算 需要 非常 快速 的 计算 机 ， 而 且 要 求 必须 迅速 给 
出 预报 结果 。 大 气 区 域 被 分 成 很 多 小 区 域 ， 并 以 固定 的 时 间 间 隔 测 量 湿度 、 气 压 和 其 他 气象 
条 件 。 这 些 也 要 与 卫星 拍 振 的 照片 进行 比较 。 在 这 些 数据 的 基础 上 ， 计 算 机 对 未 来 24 小 时 或 
48 小 时 的 天 气 进行 预报 。 如 果 观 测 数据 是 即时 的 ， 只 有 完成 计算 、 得 到 结果 ， 并 在 24 小 时 流 
逝 之 前 把 结果 广播 给 公众 ， 对 未 来 24 小 时 的 天 气 预报 才 算 有 用 。 天 气 预报 结果 的 可 靠 性 随 着 





数据 量 的 增加 而 提高 ， 即 分 成 的 区 域 越 小 ， 收 集 和 处 理 的 数据 越 多 ， 预 报 的 可 靠 性 就 越 高 。 
但 是 ， 处 理 更 多 的 数据 可 能 需要 普通 的 计算 机 超过 24 小 时 的 处 理 时 间 。 因 此 ， 为 了 快速 得 到 
更 可 靠 的 预报 结果 ， 目 前 的 计算 机 是 不 够 的 。 

医学 诊断 之 前 已 经 讨论 过 这 个 应 用 。 能 够 进行 诊断 的 计算 机 根据 病人 的 症状 ， 进 行 疾病 
诊断 。 
智能 机 器 机 器 人 是 能 够 胜任 特定 工作 (比如 组 装 汽车 、 充 当 接待 员 等 ) 有 特殊 目的 的 自 
动 计算 机 。 它 们 需要 上 面 提 到 的 多 种 不 同 能 力 。 为 它们 编写 的 软件 因此 非常 复杂 ， 并 需要 可 
想象 到 的 最 快 的 计算 速度 。 自 治 移动 机 器 人 (Autonomous Mobile Robot，AMR ) 是 能 够 进行 
自治 决策 和 行动 的 人 工 智 能 操作 系统 。AMR 能 够 管理 自己 完成 特定 目标 ， 并 同时 管理 自己 的 
资源 和 维护 系统 的 一 致 性 。 这 些 能 力 来 源 于 它们 在 感应 到 的 和 计算 得 到 的 信息 基础 上 ， 与 不 
断 变 化 的 环境 进行 交互 的 能 力 。AMR 的 设计 包括 如 下 方面 的 研究 任务 : 

1. 快速 多 模型 感知 和 集成 : 通过 多 种 不 同 的 传感器 快速 感应 外 部 事件 并 把 这 些 信息 进行 
有 意义 集成 的 能 力 ; 

2. 实时 响应 : 在 没有 不 适当 延迟 的 情况 下 ， 作 出 决策 并 采取 适当 的 行动 达到 目标 的 能 力 ; 

3. 实时 中 断 ; 中 断 当前 的 正常 操作 ， 对 发 生 在 周围 的 外 部 事件 进行 及 时 反应 并 在 处 理 后 
返回 被 中 断 任 务 的 能 力 ; 

4. 容错 : 在 内 部 出 现 错误 的 情况 下 ， 依 赖 于 其 他 功能 部 件 继续 操作 的 能 力 。 

上 述 工作 涉及 高 度 复杂 和 快速 的 处 理 ， 目 前 的 计算 机 不 能 胜任 。 

随 着 技术 的 进步 使 此 类 系统 更 加 接近 实用 ，AMR 研 究 的 实际 重要 性 在 稳步 提高 。 工 业 机 
器 人 已 经 在 涉及 单调 和 琐 雁 任务 的 工业 应 用 和 有 危害 环境 (如 核反应 堆 等 ) 中 得 到 应 用 。 为 
深海 挖掘 和 打捞 操作 、 太 空 服务 /组 装 任务 .化 工厂 等 有 毒 环 境 维护 活动 而 设计 的 下 一 代 机 器 
人 已 经 列 入 日 程 。 

高 性 能 的 第 五 代 计 算 机 的 应 用 还 包括 飞机 试航 、 新 药 开发 、 石 油 勤 探 、 建 模 融 合 、 反 应 
堆 、 实 时 经 济 规划 、 密 码 分 析 、 天 文学 、 生 物 医 学 分 析 、 地 震 学 、 空 气动 力学 、 原 子 物 理学 、 
核 物 理学 和 等 离子 物理 学 等 。 

0.2 并 行 计算 机 

上 一 节 ， 我 们 已 经 看 到 当前 的 计算 机 在 一 些 重要 应 用 中 无 能 为 力 。 本 节 将 介绍 针对 重要 
应 用 所 使 用 的 并 行 计 算 机 的 概念 。 图 0-4 给 出 一 个 简单 的 计算 机 模型 。 为 了 简化 ， 这 里 没有 考 
虑 输入 输出 。 处 理 器 与 内 存 相连 接 。 它 读 取 放 在 内 存 中 的 数据 ， 在 处 理 之 后 再 存 人 内 存 。 由 
于 VLSI 技 术 的 高 度 进步 ， 包 含有 10 个 逻辑 门 的 高 性 能 处 理 器 芯片 已 经 出 现 。 其 线 宽 非 常 细 ， 
小 于 0.5 微 米 (1 微米 =10- 米 )， 存 储 密度 达到 每 平方 厘米 1000KB。 一 种 最 新 的 Alpha 微 处 理 
器 的 主 频 据 称 达 到 了 400MHz。 通 过 这 些 芯 片 ， 我 们 获得 了 所 
谓 的 可 能 的 最 高 速度 ， 科 学 家 开始 怀疑 能 否 建造 更 快 的 设备 。 
遗憾 的 是 ， 这 些 最 快 的 处 理 器 仍 不 能 满足 在 气象 预报 、 海 洋 
学 、 空 间 物 理学 、 空 气动 力学 、 图 像 处 理 和 遥感 等 领域 的 需 
要 。 这 些 在 上 节 已 经 讨论 过 了 。 处 理 器 

在 普通 的 计算 机 里 ， 一 般 只 有 一 个 处 理 器 。 为 了 进一步 
提高 性 能 ， 就 需要 更 多 的 处 理 器 。 此 类 计算 机 就 称 作 并 行 计 图 0-4 _ 串 行 计算 机 模型 
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工 机 。 只 有 一 个 处 理 器 的 计算 机 称 作 串 行 计算 机 。 我 们 可 以 用 前 一 节 介绍 的 字符 识别 应 用 来 
解释 什么 是 并 行 《 参 见 图 0-3 )。 当 用 串 行 计算 机 的 时 候 ， 概 率 P (A), P (B)… 在 一 个 处 理 器 上 
顺序 计算 。 另 一 个 方法 是 可 以 用 多 个 处 理 器 同时 计算 这 些 概率 。 如 图 0-5 所 示 。 








处 理 器 A 
计算 P(A) 







计算 P(B) 





处 理 器 Z 
计算 P(Z) 






计算 机 
图 0-5 字符 识别 的 并 行 性 


0.3 ”并行 处 理 的 概念 


要 用 并 行 计算 机 求解 问题 ， 必 须 把 问题 分 解 成 能 够 并 行 求解 的 子 问题 。 而 后 这 些 子 问 题 
的 结果 需要 进行 高 效 的 重新 组 合 得 到 主 问题 的 最 后 结果 。 把 每 一 个 非常 大 的 问题 分 成 子 问题 
是 很 不 容易 的 ， 这 是 由 于 子 问 题 之 间 可 能 存在 数据 相关 性 。 由 于 数据 相关 性 ， 处 理 器 之 间 必 
须 相 互通 信 。 需 要 解决 的 重要 一 点 是 两 个 处 理 器 之 间 的 通信 时 间 。 通 常 ， 两 个 处 理 器 之 间 的 
通信 时 间 与 处 理 时 间 相 比 是 很 高 的 。 由 于 上 述 因素 ,为 了 得 到 好 的 并 行 算法 ， 通 信和 方案 应 该 
进行 很 好 地 规划 。 

我 们 通过 一 个 生活 中 的 例子 来 说 明 可 分 解 性 和 数据 相关 性 。 考 察 一 个 有 人 力 资 源 和 其 他 
资源 的 建筑 承包 商 能 在 五 个 月 内 造 出 一 幢 房 子 。 假 定 该 承包 商 不 能 同时 造 一 幢 以 上 房屋 。 如 
果 房 屋 建筑 委员 会 给 该 承包 商 提 供 造 100 幢 房子 的 合同 ， 他 一 个 接 一 个 地 去 造 ， 需 要 500 个 月 
完成 任务 。 图 0-6 仅 仅 演示 四 幢 房 子 的 情况 。 如 果 房 屋 建筑 委员 会 想 加 快 房屋 的 建造 速度 ， 他 
可 以 雇佣 100 个 不 同 的 建筑 承包 商 辣 时 建造 100 幢 房子 。 在 这 种 情况 下 ， 可 以 在 五 个 月 内 完成 
建造 100 幢 房子 的 任务 。 如 果 没 有 100 个 建筑 承包 商 ， 而 只 有 10 个 ， 那 么 可 以 在 50 个 月 内 完成 。 
图 0-7 演 示 两 个 建筑 承包 商 在 15 个 月 内 完成 6 幢 房 子 的 建造 过 程 。 这 是 一 个 工作 容易 分 解 的 例 
子 。 这 里 的 每 幢 房 子 都 是 独立 的 单元 ， 因 此 我 们 能 够 容易 地 对 主 问题 进行 分 解 。 

现在 让 我 们 来 考虑 一 幢 房 子 的 建造 工作 。 把 它 分 成 五 个 步骤 ; 

第 1 步 ， 建 造 地 基 ; 

第 2 步 ， 建 造 地 上 结构 ; 

第 3 步 ， 完 成 木工 部 分 ， 如 安装 窗户 、 门 等 ; 

第 4 步 ， 安 装 电气 系统 ; 

第 5 步 ， 油 梁 和 装饰 。 

值得 注意 的 是 ， 上 述 五 个 步 又 不 能 同时 进行 ， 每 个 步骤 都 必须 等 待 前 面 的 步骤 完成 。 可 
以 说 它们 是 内 在 囊 行 的 。 在 这 种 情况 下 ， 把 任务 分 成 子 任务 是 困难 的 事情 。 然 而 ， 如 果 一 个 
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承包 商 有 五 组 不 同 的 人 完成 上 述 五 个 步骤 ， 他 或 她 就 可 以 更 高 效 地 完成 该 任务 。 让 我 们 假定 
每 组 人 可 以 在 一 个 月 内 完成 自己 的 任务 。 当 第 一 幢 房 子 的 第 1 步 完 成 之 后 ,第 二 组 人 将 开始 第 
一 幢 房 子 的 第 2 步 。 与 此 同时 ， 第 一 组 人 将 开始 第 二 幢 房 子 的 第 1 步 。 这 些 在 图 0-8 中 给 出 。 


















建筑 承包 商 2 





时 间 (月 ) 
图 0-7 房屋 建造 中 的 并 行 性 


这 一 并 行 过程 就 称 作 流水 线 。 在 上 面 给 出 的 例子 中 ， 在 第 五 个 月 里 ， 所 有 的 组 都 工作 在 
不 同 的 房子 上 。 
第 一 组 在 进行 第 五 幢 房 子 的 第 1 步 ; 
第 二 组 在 进行 第 四 幢 房 子 的 第 2 步 ; 
第 三 组 在 进行 第 三 幢 房 子 的 第 3 步 ; 
第 四 组 在 进行 第 二 幢 房 子 的 第 4 步 ; 
第 五 组 在 进行 第 一 幢 房 子 的 第 5 步 。 
在 第 五 个 月 结束 的 时 候 ， 第 一 由 房子 已 经 完成 。 从 第 五 个 月 开始 ， 每 个 月 都 完成 一 幢 房 
子 。 在 这 种 情况 下 ， 承 包 商 能 够 以 每 月 一 幢 的 速度 进行 房屋 的 建造 。 D3j 
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图 0-8 房屋 建造 中 的 流水 线 


让 我 们 用 另外 一 个 例子 来 说 明 问 题 的 可 分 解 性 和 子 问 题 之 间 的 相互 依赖 性 。 假 定 有 一 家 
公司 ， 需 要 安装 100 台 相同 的 机 器 。 如 果 有 一 个 工程 师 小 组 ， 他 们 只 能 每 次 组 装 一 台 机 器 ， 那 
么 他 们 能 在 100 个 时 间 单位 内 完成 这 项 工作 。 如 果 有 100 个 不 同 的 工程 师 小 组 能 同时 工作 ， 那 
么 就 可 以 在 一 个 单位 时 间 内 完成 任务 。 如 果 每 个 小 组 包含 三 个 分 组 ， 分 别 进行 设备 安装 (机 
械 工程 师 )、 电 气 安装 (电气 工程 师 ) 和 测试 (过程 控制 人 员 )， 那 么 可 以 流水 线 操作 。 

以 上 我 们 讨论 了 流水 线 的 概念 。 并 行 处 理 中 的 另 一 个 重要 概念 是 多 处 理 。 它 是 指 不 同 处 
理 器 同时 处 理 多 个 任务 。 一 般 分 成 两 大 类 : 

1. 多 处 理 器 ; 

2.. 多 计算 机 。 

在 多 处 理 器 系统 中 ， 多 个 处 理 器 同时 工作 ， 并 共享 存储 器 。 在 多 计算 机 中 ， 有 一 组 处 理 
器 ， 每 个 处 理 器 都 有 足够 的 本 地 存储 器 。 处 理 器 之 间 的 通信 是 通过 消息 进行 的 。 这 也 称 作 分 
布 式 处 理 。 这 种 情况 下 既 没 有 公用 存储 器 也 没有 公用 时 钟 。 


0.4 高 性 能 计算 机 


由 于 技术 进步 的 刺激 ， 过 去 的 四 十 五 年 间 出 现 了 大 量 的 硬件 设计 方案 ， 这 些 推动 计算 机 
工业 经 历 了 前 所 未 有 的 快速 变化 和 发 展 。 从 物理 上 看 ， 显 著 的 标志 就 是 计算 机 基本 部 件 从 继 
电器 和 真空 管 (20 世 纪 40 年 代 至 50 年 代 ) 发 展 到 目前 的 超大 规模 集成 电路 (IC )。 

由 于 上 述 技术 的 进步 和 设计 的 改进 ， 计算机 经 历 了 从 20 世 纪 50 年 代 速度 很 慢 的 单 处 理 絮 
到 今天 的 高 性 能 计算 机 (包括 峰值 速度 是 早期 计算 机 成 千 上 万 倍 的 超级 计算 机 ) 的 显著 变化 。 
工程 师 和 科学 家 对 更 强大 数字 计算 机 的 需求 是 推动 数字 计算 机 发 展 的 主要 力量 。 获 得 高 速 计 
算 能 力 一 直 是 最 具 挑 战 性 的 需求 。 计 算 机 工业 界 对 这 些 挑战 的 回应 是 丰富 多 彩 的 ， 其 结果 就 
是 在 短 短 的 四 十 年 左右 的 时 间 里 计算 机 所 取得 的 显著 进展 。 这 些 从 这 几 十 年 里 所 开发 的 商用 
和 试验 性 高 性 能 计算 系统 中 可 以 很 好 地 体现 。 上 面 提 到 的 各 种 各 样 的 科学 技术 应 用 对 更 强大 
系统 的 需求 在 21 世 纪 也 不 会 减弱 。 

革命 性 的 设计 使 得 技术 转变 进一步 加 快 ， 这 经 常 伴随 技术 的 改进 而 出 现 。 现 代 计 算 机 最 
常见 的 设计 技术 是 加 入 并 行 的 特性 。 自 从 20 世 纪 60 年 代 以 来 ， 文 献上 提出 了 成 百 上 千 的 高 度 





争 0 草 绰 言 9 


并 行 体系 结构 ， 许 多 在 70 年 代 被 建造 并 投入 使 用 。 

1972 年 ，Illiac IV 在 NASA Ames 研 究 中 心 投入 运行 ， 这 是 德州 仪器 公司 的 第 一 台 并 行 计 
算 机 ; 同年 ， 德 州 仪 器 公司 先进 的 科学 计算 机 (TI-ASC) 在 欧洲 投入 使 用 ; 1974 年 ， 控 制 数 
据 公司 (CDC) 的 第 一 台 并 行 机 Star-100 在 Lawrence Livermore 国 家 实验 室 投 入 使 用 ; 1976 年 ， 
Cray 公 司 的 第 一 台 并 行 机 Cray-1 在 Los Alamos 国 家 实验 室 投 入 使 用 。 

上 面 提 到 的 机 器 不 但 是 创新 设计 的 开拓 者 ， 赋 予 了 机 器 前 所 未 有 的 计算 能 力 ， 而 且 也 是 
后 来 发 布 的 一 系列 更 加 强大 机 器 的 先驱 。 因 此 ， 在 它们 依然 名 声 显赫 的 时 候 ， 便 迅速 地 让 位 
给 了 其 他 用 代 更 加 强大 的 计算 机 ， 并 最 后 发 展 成 现代 的 超级 计算 机 。 到 20 世 纪 80 年 代 ， 大 量 
的 20 世 纪 60 和 70 年 代 生 产 的 高 速 处 理 器 或 者 停止 运行 或 者 扮演 越 来 越 次 要 的 角色 。 与 此 同时 ， 
处 理 速度 的 增加 和 性 能 价格 比 的 提高 从 未 减弱 。 最 后 的 结果 就 是 引入 了 新 的 根本 的 体系 结构 
设计 理念 ， 如 精简 指令 集 计算 机 RISC (一 种 广泛 商业 化 的 多 处 理 ) 和 超大 规模 并 行 MPP 的 出 
现 。 这 样 ，Illiac IV 在 1981 年 停止 运行 ; TI-ASC 从 1980 年 开始 不 再 生产 ; 从 1976 年 开始 ， 
Star-100 演 化 成 CDC Cyber 203 (已 经 停产 ) 和 Cyber 205， 这 也 标志 着 CDC 公 司 进 入 到 超级 计 
算 领 域 ; Cray-1 ( 流水线 单 处 理 器 ) 已 经 演化 成 Cray-1S ， 比 原来 的 Cray-1 有 大 得 多 的 存储 容 
量 。 下 面 是 一 些 性 能 更 高 的 计算 机 : 

。Cray XMP4 (4 处 理 器 ， 128M 字 超级 计算 机 ，、 峰 值 速度 840MFLOPS); 

。Cray-2 (256M 字 ，4 处 理 器 ， 可 重 构 超 级 计算 机 ， 峰 值 速 度 2GFLOPS ) ; 

。Cray-3 (16 处 理 器 ，2G 字 超级 计算 机 ， 峰 值 速度 16GFLOPS ) 。 

其 他 在 20 世 纪 80 年 代 生 产 的 超级 计算 机 包括 Eta-10、Fujitsu VP-200、Hitachi S-810 和 1]BM 
3090/400/VF。 到 20 世 纪 80 年 代 ，60 和 70 年 代 的 高 速 处 理 器 已 经 发 展 成 了 80 年 代 到 90 年 代 的 超 
级 计算 机 。 

别 的 一 些 计算 机 也 有 历史 意义 ， 虽 然 其 开发 的 最 初 目的 不 是 数值 计算 。 它 们 包括 
Goodyear 公 司 的 STARAN 和 卡 内 基 一 梅 隆 大 学 的 C.mmp 系 统 。 还 有 些 机 器 有 一 定 的 历史 意义 ， 
虽然 没有 得 到 商用 ， 比 如 Burroughs 公 司 的 科学 处 理 器 (Scientific Processor， CSP)。 

阵列 处 理 器 的 问世 ”Illiac-IV 只 有 64 个 处 理 器 。 另 外 一 些 计 算 机 有 大 量 的 处 理 器 ， 如 
Deneleor 的 HEP、 国 际 计算 机 公司 的 数据 阵列 处 理 器 (ICL DAP)、NASA Langley 研 究 中 心 的 
有 限 元 机 器 、Lawrence Berkeley 实 验 室 的 MIDAS 、 加 州 理 工学 院 的 Cosmic Cube、 德 州 大 学 
的 TRAC、 卡 内 基 - 梅 隆 大 学 的 CM*、 马 里 兰 大 学 的 ZMOB、 华盛顿 大 学 和 普度 大 学 的 Pringle、 
NASA Goddard 空 间 飞 行 中 心 的 超大 规模 并 行 处 理 器 (MPP) 等 等 。 其 中 只 有 少数 几 个 《如 
MPP、ICL DAP) 主要 是 为 数值 计算 设计 的 ， 其 他 的 都 是 用 于 研究 。 


0.5 本 书 的 结构 和 内 容 


本 书 分 四 个 阶段 介绍 并 行 算法 的 概念 。 第 一 部 分 介绍 并 行 算法 设计 的 基础 概念 ， 包 括 流 
水 线 、 多 处 理 、 分 时 和 共享 存储 器 模型 。 由 于 数据 结构 是 并 行 算法 很 重要 的 组 成 部 分 ， 专 门 
用 一 章 介绍 各 种 数据 结构 。 图 模型 在 信息 处 理 中 是 很 重要 的 数据 结构 ， 因 此 加 以 特别 强调 。 
对 并 行 算法 设计 中 一 些 很 重要 的 范例 作 了 详细 的 说 明 。 

本 书 的 第 二 部 分 介绍 关于 图 的 并 行 算法 。 研 究 了 各 种 图 问题 的 类 型 并 设计 其 并 行 算法 。 
特意 用 一 章 讨论 弦 图 类 型 ， 主 要 是 针对 它 的 识别 算法 和 一 些 优化 问题 的 算法 。 

第 三 部 分 介绍 数组 的 操作 。 在 两 章 里 给 出 了 很 多 关于 排序 、 搜 索 和 合并 问题 的 重要 算法 。 
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第 四 部 分 介绍 数值 计算 的 并 行 算法 。 其 中 一 章 给 出 代数 方程 的 并 行 算法 。 另 外 两 章 介绍 
微分 、 积 分 和 微分 方程 (包括 偏 微 分 方程 ) 的 算法 。 
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第 1 章 并 行 计算 要 素 


前 一 章 已 经 介绍 了 对 并 行 计算 机 的 需求 。 本 章 重 点 介绍 并 行 计算 机 的 基本 概念 。 并 行 计 
算 机 的 分 类 和 各 种 不 同 的 并 行 计算 模 型 也 在 本 章 进行 详细 讨论 。 
1.1 并 行 的 层次 

并 行 可 以 在 不 同 的 层次 实现 。 例 如 ， 如 果 10 个 作业 都 不 相同 且 两 两 独立 ， 那 么 这 10 个 作 
业 可 以 分 配给 10 个 不 同 的 机 器 。 由 于 这 些 作 业 并 行 执 行 ， 其 并 行 性 是 高 层次 的 。 通 常 把 这 种 
并 行 称 为 作业 级 并 行 或 者 程序 级 并 行 。 为 了 进一步 提高 程序 的 效率 ， 我 们 可 以 发 据 下 一 个 层 
次 的 并 行 。 每 个 作业 可 以 分 成 更 小 的 子 任 务 。 这 些 子 任务 可 以 并 行 执行 ， 并 通过 合并 结果 得 
到 最 终结 果 。 对 每 一 个 子 任务 ， 都 有 一 个 子 程序 且 这 些 子 程序 可 以 并 行 执行 ， 这 就 是 通常 所 
谓 的 子 程序 级 并 行 。 任 何 程 序 或 子 程序 都 有 若干 语句 ， 这 些 语句 可 以 并 行 执行 ， 这 种 并 行 称 
为 语句 级 并 行 。 在 一 个 语 旬 里 可 以 执行 多 个 操作 。 我 们 可 以 考虑 这 些 操作 的 并 行 执行 ， 这 称 
为 操作 级 并 行 。 通 常 ， 一 个 操作 又 由 若干 微 操作 组 成 。 比 如 ， 两 个 变量 4 和 B 相 加 ， 并 把 结 
果 存 到 C 变量 里 。 这 个 操作 包含 如 下 微 操作 : 

1. 把 4 的 内 容 加 载 到 累加 器 里 ; 

2. 把 互 的 内 容 和 累加 器 里 的 内 容 相 加 ; 

3. 把 累加 器 里 的 内 容 存 人 变量 C 中 。 

如 果 并 行 执行 微 操 作 ， 则 称 为 微 操作 级 并 行 ( 见 图 1-1)。 程 序 级 并 行 和 子 程序 级 并 行 很 
容易 理解 ， 不 需要 进一步 的 解释 。 为 了 说 明 语句 级 并 行 ， 我 们 以 下 面 的 算法 为 例 : 

Fori=1]tondo 


XxX+l1 


串 行 处 理 





子 程序 级 并 行 





微 操作 级 并 行 


图 1-1 并 行 的 层次 


在 上 面 的 算法 中 ， 对 每 个 x 加 1。 这 个 语句 串 行 执行 地 次 ， 因 此 需要 O(n) 的 时 间 。 这 是 
可 以 并 行 的 ， 可 以 用 n 个 处 理 器 同时 在 0(1) 的 时 间 完 成 。 在 这 种 情况 下 ， 我 们 可 以 把 算法 写成 
下 面 的 形式 : 
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For i= 1 to n do in parallel 
Xxi+l 


End parallel 
上 面 的 算法 需要 n 个 处 理 器 ， 它 们 可 能 是 Pi, P,,…, P,。 处 理 器 Pi 执行 x 一 x;+ 1 操作 。 所 有 
处 理 器 同时 工作 ， 并 在 0O(1) 时 间 内 完成 。 这 种 类 型 的 并 行 被 称 为 语 身 级 并 行 。 
现在 考虑 下 面 给 出 的 算法 : 
SO 
Fori=1tondo 
SS+xX, 
这 个 算法 求 和 
S 三 XI 十 Xe + + x 
请 注意 该 算法 不 能 像 前 一 个 算法 那样 并 行 ， 它 可 以 采用 不 同 的 并 行 方法 ， 在 O(log 门 时 间 
完成 。 我 们 将 在 第 3 章 给 出 完整 的 并 行 方 法 。 操 作 级 并 行 与 此 类 似 。 考 虑 语句 
Yo-a+b+c 
在 这 个 语句 中 ， 人 必须 计算 a', b, ce， 并 把 和 存在 了 里 。 对 a', b,c* 的 计算 可 以 用 三 个 不 同 
处 理 器 执行 ， 这 就 是 操作 级 并 行 。 综 合 上 述 并 行 的 层次 ， 我 们 在 下 一 节 来 看 一 下 Flynn 和 
Handler 是 如 何 对 并 行 计算 机 进行 分 类 的 。 


1.2 并 行 计算 机 分 类 


20 世 纪 的 最 后 30 年 出 现 了 各 种 并 行 处 理 的 新 计算 机 体系 结构 ， 这 些 是 对 并 行 计算 主要 方 
法 的 补充 和 扩充 。 最 近 并 行 处 理 技 术 扩 展 包含 了 几 种 新 的 硬件 体系 结构 。 现 在 该 领域 面临 的 
一 个 重大 障碍 是 总 结 现 有 的 并 行 计 算 体系 结 构 ， 并 定义 它们 之 间 的 有 序 关 系 。 我 们 先 介绍 最 
早 但 最 流行 的 Flynn 分 类 ， 然 后 介绍 最 近 提 出 的 对 Flynn 分 类 不 足 方面 进行 修正 的 Handler 
(Erlangen) 分 类 以 及 其 他 一 些 分 类 。 


1.2.1 Flynn 分 类 


任何 系统 都 包含 两 个 重要 的 组 成 元 素 : 
1, 指令 ; 
2. 数据 。 
对 数据 元 素 的 操作 依据 指令 进行 。 根 据 执行 的 指令 和 同时 操作 的 数据 的 数目 ，Flynn 做 出 了 
如 下 分 类 。 其 中 最 简单 的 是 通常 的 串 行 计算 数据 
机 ， 即 每 条 指令 一 次 只 对 一 个 数据 集 执行 操 
作 。Flynn 称 之 为 单 指令 单数 据 (Single 
Instruction Single Data, SISD) 系统 。 图 1-2 所 
示 为 SISD 模 型 。 处 理 器 
单 指令 多 数据 《Single Instruction Multiple 指令 结果 
Data, SIMD ) 系统 是 指 间 一 条 指令 同时 对 不 
同 的 数据 集 进行 并 行 操作 。 这 里 的 数据 集 个 图 1-2 SISD 模 型 
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数 是 同时 进行 操作 的 处 理 器 的 数量 。 图 1-3 所 示 为 SIMD 模 型 。 比 如 ， 对 一 个 数组 的 每 个 元 素 
都 加 1: 


Fori=1tondo 


Xx+l 





图 1-3 SIMD 模 型 


上 述 计算 可 以 直接 并 行进 行 。 我 们 可 以 指定 个 处 理 器 P,, P,, …, P,。 如 果 这 些 处 理 器 是 
SIMD 体 系 结构 ， 那 么 对 每 个 处 理 器 都 给 予 共同 的 “对 数据 加 1” 的 指令 。 每 个 处 理 器 已 会 得 
到 x,， 并 对 它 加 1。 可 以 看 出 不 同 处 理 器 的 数据 不 同 而 指令 相同 。 在 SIMD 模 型 中 ， 有 两 种 类 型 
的 体系 结构 : 

1. 共享 存储 器 模型 ; 

2. 直接 连接 网 络 。 

在 共享 存储 器 模型 中 有 一 个 所 有 处 理 器 共享 的 内 存 。 两 个 处 理 器 之 间 的 通信 是 通过 共享 
内 存 实现 的 。 这 在 图 1-4 中 给 出 。 在 直 连 网 络 模型 中 、 独 立 的 处 理 器 通过 网 线 连接 ， 它 们 可 以 
根据 不 同 的 拓扑 结构 (如 环 型 、 超 立方 体 等 ) 进行 连接 。 我 们 在 第 1.3 节 讨论 这 个 问题 。 





图 1-4 共享 存储 器 模型 
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Flynn 也 解释 了 多 指令 单数 据 (Multiple Instruction Single Data, MISD) 系统 ， 它 能 是 对 
单个 数据 集 执 行 多 个 不 同 操作 的 机 器 理论 模型 。 目 前 为 止 ， 还 没有 设计 出 符合 这 种 模型 的 计 
算 机 。 图 1-5 展 示 该 模型 。 


指令 3 


指令 2 
: 
指令 1 


图 1-5 MISD 模 型 


多 指令 多 数据 (Multiple Instruction Multiple Data，MIMD ) 模型 是 指 多 处 理 器 系统 ， 它 
有 多 个 处 理 器 ， 可 以 独立 运行 并 生成 全 局 系统 的 结果 。 每 个 处 理 器 都 可 以 执行 单独 的 指令 对 
单独 的 数据 集 进 行 操 作 。 

虽然 Flynn 的 分 类 提供 计算 机 体系 结构 的 基本 特征 ， 但 却 不 足以 对 当前 的 计算 机 进行 有 效 
分 类 。 比 如 ， 流 水 线 向 量 处 理 器 组 成 的 并 行 计算 机 ， 体 系 结构 应 包含 在 分 类 之 列 ， 因 为 它们 
能 够 执行 大 量 的 并 发 算术 运算 ， 且 能 并 行 操 作成 百 上 千 的 向 量 元 素 。 但 由 于 这 些 计算 机 的 处 
理 器 不 能 像 SIMD 计 算 机 一 样 通过 单 步 同 步 执行 同一 指令 ， 且 没有 MIMD 模 型 的 自主 能 力 , 我 
们 不 能 把 它 归 入 任何 一 类 Flynn 分 类 中 。 由 于 Flynn 分 类 的 缺陷 ， 已 经 有 一 些 党 试想 通 过 对 
Flynn 分 类 进行 扩展 来 囊括 新 的 并 行 计 算 机 体系 结构 。 由 于 其 所 依据 的 原则 与 Fiynn 分 类 不 同 ， 
有 另外 两 种 与 Flynn 分 类 截然 不 同 的 分 类 。 但 是 这 些 分 类 通常 缺乏 Flynn 分 类 所 具有 的 内 在 简 
单 性 ， 因 此 不 能 像 Flynn 分 类 一 样 被 广泛 采用 。 在 下 面 几 节 里 ， 我 们 将 给 出 这 两 种 分 类 特点 的 
简 述 。 这 两 种 分 类 分 别 是 Erlangen 分 类 (由 Erlangen-Numberg 的 Friederich Alexander 大 学 的 
Handler 提 出 ) 和 由 Giloi 提 出 的 Giloi 分 类 。 


1.2.2 ” Erlangen 分 类 (Handier 分 类 ) 


与 Flynn 的 分 类 不 同 ，Erlangen 分 类 系统 是 基于 对 硬件 的 三 层 分 类 : 

1. 程序 控制 单元 (Program Control Unit, PCU) ; 

2. 算术 逻辑 单元 (Arithmetic Logic Unit, ALU ) ; 

3. 基本 风 辑 电路 (Elementary Logic Circuit, ELC ) 。 

通常 ， 一 个 计算 机 包含 一 个 或 多 个 PCU; 每 个 PCU 控 制 一 个 或 多 个 ALU; 一 个 ALU 由 和 
其 数据 通道 位 数 一 样 多 的 多 个 ELC 组 成 。w = (ELC/ALU) 是 机 器 的 字 长 度 。 在 这 个 分 类 系统 
中 ， 一 个 计算 机 c 的 最 简 描述 是 一 个 三 元 组 : t(c) = (k, d, w)， 其 中 是 PCU 的 个 数 ，d 是 
(ELC/PCU) 的 值 ，w 是 (ELC/ALU) 的 值 。 任 何 计算 机 都 可 以 根据 这 三 个 参数 分 类 : 
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例如 : 
HIBM 701) = (1,1,36); 
t(Hliac IV) = (1, 64, 64); 
tc.mmp) = (16, 1, 10)。 
1.2.3 Giloi 分 类 
Giloi 分 类 模式 依据 形式 文法 : 


G=《〈VW，VT,P,S) 

对 体系 结构 进行 分 类 ， 其 中 WV 是 表示 某 些 复杂 的 或 者 更 高 层 的 体系 结构 特征 的 非 终结 符号 
的 集合 ; Vi 是 表示 基本 的 、 示 定义 或 “公理 性 的 ”体系 结构 特征 的 终结 符号 的 集合 ; P 是 表示 由 
其 他 (基本 的 或 复杂 的 ) 特征 组 合 而 成 的 复杂 体系 结构 特征 的 结果 的 集合 ; 3 表示 计算 机 体系 结 
构 的 起 始 符号 。 基 于 上 述 概念 ，Giloi 分 类 模式 能 够 用 一 个 语法 分 析 树 完成 任何 体系 结构 的 分 类 。 

除了 Erlangen 和 Giloij 这 两 个 与 Fiynn 分 类 依据 截然 不 同 的 体系 之 外 ， 其 他 一 些 文献 中 提出 
的 分 类 体系 主要 是 对 Flynn 分 类 的 扩展 ， 以 便 把 新 的 计算 机 体系 结构 包括 进去 。 其 中 最 有 名 的 
是 Hwang-Brigg 分 类 和 Duncan 分 类 。 


1.2.4 Hwang-Brigg 分 类 


Hwang-Brigg 分 类 是 通过 对 Flynn 分 类 进行 如 下 四 项 修改 得 到 的 : 

1. 取消 MISD 模 型 ; 

2. 把 原来 的 SISD 模 型 精细 化 为 两 个 子 模型 : 只 有 一 个 功能 部 件 的 处 理 器 (SISD-S) 和 有 多 
个 功能 部 件 的 处 理 器 (SISD-M); 

3. 把 原来 的 SIMD 模 型 精细 化 成 为 两 个 子 模型 : 进行 字 片 (word-slice) 处 理 的 机 器 
(SIMD-W) 和 进行 位 片 (bit-slice) 处 理 的 机 器 (SIMD-B) ; 

4. 把 原来 的 MIMD 模 型 精细 化 成 为 两 个 子 模型 : 处 理 器 松 耦 合 的 机 器 (MIMD-L) 和 处 理 器 
紧 耦 合 的 机 器 (MIMD-T)。 

Hwang-Brigg 的 改进 增强 原 有 模式 的 预测 能 力 。 在 这 种 情况 下 ，SISD-M 具 有 比 SISD-S 更 
高 的 性 能 。 然 而 ， 对 SIMD-B 和 SIMD-W 不 能 作出 这 样 的 一 般 性 结论 。 我 们 用 Hwang-Brigg 分 


类 方法 对 以 下 几 种 机 器 进行 分 类 。 
例子 : 依据 其 最 大 潜在 并 行 度 ， 下 列 机 器 根据 性 能 的 上 升 顺序 排列 : 
STARAN : (SIMD-B) 
Tlliac IV : (SIMD-W) 
PEPE : (SIMD-W) 
MPP (Aerospace) : (SIMD-B) 


因此 ， 位 片 机 器 的 性 能 可 以 比 字 片 机 器 的 性 能 好 ， 也 可 以 比 它 差 。 
1.2.5 Duncan 分 类 


Duncan 对 Flynn 分 类 提出 了 一 些 改进 ， 以 便 包 含 流水 线 向 量 处 理 器 和 其 他 直观 上 被 认为 是 
并 行 计算 机 但 又 不 能 被 原来 的 Flynn 分 类 模式 容纳 的 机 器 。 它 主要 是 通过 对 分 类 依据 的 简单 扩 
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展 ， 增 加 Flynn 模 式 中 没有 的 子 类 别 ， 以 反映 体系 结构 特点 的 变化 和 覆盖 底层 的 并 行 特点 。 图 
1-6 给 出 基于 Duncan 改 进 的 分 类 。 主 要 有 三 类 

1. 同步 体系 结构 ; 

2. MIMD; 

3. MIMD 变 形 。 


向 量 处 理 器 阵列 
同步 体系 结构 am —| 
脉动 相 联 存储 


分 布 式 存储 
MIMD 
共享 存储 


MISD/SIMD 
数据 流 
MIMD 变 形 
归 约 
波 前 


图 1-6 Duncan 对 Flynn 分 类 的 改进 


同步 体系 结构 同步 体系 结构 通过 全 局 时 钟 、 中 央 控 制 部 件 或 向 量 部 件 控制 器 在 同步 中 协 
调 并 发 操作 。 该 类 体系 结构 包括 三 个 子 类 。 它 们 是 : 

1. 向 量 处 理 器 ; 

2. 脉动 阵列 ; 

3. SIMD 体 系 结构 。 

SIMD 体 系 结构 更 进一步 分 成 处 理 器 阵列 和 相 联 存储 处 理 器 。 

向 量 处 理 器 向 量 处 理 器 的 特点 是 用 多 个 流水 线 功能 部 件 对 向 量 操作 数 提供 并 行 向 量 处 理 
功能 。 有 两 类 向 量 处 理 器 : 寄存 器 到 寄存 器 向 量 处 理 器 和 内 存 到 内 存 向 量 处 理 器 。 在 寄存 器 
到 寄存 器 向 量 处 理 器 中 ， 操 作 数 和 向 量 操作 的 结果 保存 在 专用 的 高 速 寄存 器 中 ; 而 在 内 存 到 
内 存 向 量 处 理 器 中 ， 这 些 数据 保存 在 专用 的 内 存 缓存 区 中 。 在 向 量 长 度 比较 大 时 ， 向 量 处 理 
器 会 获得 比较 高 的 性 能 。 最 近 的 向 量 处 理 超级 计算 机 (如 Cray-XMP/4 和 ETA-10) 由 4 到 10 个 
处 理 器 共享 一 个 大 的 内 存 。 此 类 体系 结构 能 够 支持 任务 级 的 并 行 ， 虽 然 其 设计 基础 是 向 量 处 
理 能 力 ， 但 可 以 归 为 MIMD 体 系 结 构 。 向 量 处 理 器 的 例子 如 下 : 

。 内 存 到 内 存 向 量 处 理 器 : CDC Star 100，Cyber 203，Cyber 205, TI-ASC 

。 寄 存 器 到 寄存 器 向 量 处 理 器 : Cray-1,，Cray-2,，Cray-XMP/4, ETA-10，Fujitsu-200 

脉动 阵列 ”脉动 阵列 由 流水 线 多 处 理 器 组 成 。 数 据 以 规律 性 的 脉动 方式 流出 内 存 ，、 通 过 
处 理 器 网 络 ， 最 后 返回 内 存 。 全 局 时 钟 和 显 式 的 时 间 延 迟 对 流水 线 数据 流 进行 同步 ， 此 数据 
流 由 从 内 存 取 得 的 操作 数 和 每 个 处 理 器 使 用 的 部 分 结果 组 成 。 脉 动 阵列 计算 机 的 例子 是 Warp 
和 Saxpy 的 Matrix， 它 是 由 卡 内 基 -~ 梅 隆 大 学 设计 的 可 重 构 脉动 计算 机 。 

SIMD 处 理 器 阵列 ”处 理 器 阵列 是 为 大 规模 科学 计算 (如 图 像 处 理 和 核能 源 建 模 ) 设计 的 。 

它们 是 在 20 世 纪 60 年 代 后 期 开发 的 (如 Illiac-IV )， 稍 近 的 机 器 是 Burroughs 科 学 处 理 器 
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(Burroughs Scientific Processor, BSP)。 这 类 机 器 采用 能 够 进行 字 级 长 度 操作 的 处 理 器 。 这 些 操 
作 数 通常 是 浮 点 (或 复 型 ) 数据 ， 其 长 度 范围 从 32 位 到 64 位 。 处 理 器 阵列 的 一 个 变形 是 由 大 量 
位 处 理 器 组 成 的 处 理 器 网 格 (如 64 x 64)。 这 类 处 理 器 阵列 被 称 作 大 规模 并 行 处 理 器 
(Massively Parallel Processor，MPP ) ， 例 如 Loral 的 MPP、ICL DAP、FPS 164/MAX、Goodyear 
的 MasPar Models (MPP)、Thinking Machine 公 司 的 Connection Machine 和 SX-2 的 SCS-40 等 。 

相 联 存储 处 理 器 ”此 类 处 理 器 围绕 相 联 存储 而 制造 ， 且 包含 类 型 特别 的 SIMD 体 系 结构 ， 
这 一 结构 使 用 特殊 的 能 根据 存储 内 容 并 行 访问 存储 数据 的 比较 逻辑 。 搭 建 相 联 存 储 处 理 器 的 
研究 开始 于 20 世 纪 50 年 代 后 期 ， 其 最 明显 的 目的 是 能 够 在 内 存 中 并 行 搜索 那些 符合 某 些 特定 
条 件 的 数据 。 大 多 数 当 前 的 相 联 存储 处 理 器 采用 位 串 行 的 组 织 方式 ， 可 以 支持 对 相 联 存储 中 
所 有 字 的 一 个 位 片 ( 位 列 ) 进行 并 发 操作 。 这 类 机 器 的 例子 是 贝尔 实验 室 的 Parallel Element 
Processing Ensemble (PEPE) 和 Loral 的 Associative Processor (Aspro ) 。 

MIMD 体 系 结构 “MIMD 体 系 结构 采用 可 以 使 用 本 地 数据 执行 独立 指令 流 的 多 个 处 理 器 ， 
因此 MIMD 计 算 机 支持 处 理 器 大 范围 自治 处 理 方式 下 的 并 行 执行 。 虽 然 MIMD 体 系 结构 上 的 软 
件 进程 执行 通过 互联 网 消息 传递 或 访问 共享 存储 器 中 的 数据 进行 同步 ， 但 它们 仍 是 以 分 散 型 
硬件 控制 为 特征 的 异步 计算 机 。 因 此 ，MIMD 体 系 结构 也 多 被 称 作 多 处 理 器 。 它 可 以 分 成 两 
个 子 类 型 : 

1. 共享 存储 〈 紧 耦合 ) ; 

2. 分 布 式 存储 〈 松 耦合 )。 

共享 存储 多 处 理 器 〈 紧 耦合 ) ” 紧 耦 合 MIMD 体 系 结构 在 处 理 器 之 间 共 享 存储 器 。 互 联网 
络 结构 分 为 两 类 : 总 线 双 向 连接 和 直接 连接 。 在 总 线 双向 连接 结构 中 ， 处 理 器 、 并 行 存 储 器 、 
网 络 接口 和 设备 控制 器 都 连接 在 同一 总 线 上 ; 而 在 直接 连接 结构 中 ， 处 理 器 直接 连接 到 高 端 
大 型 机 上 。 紧 耦合 多 处 理 器 的 例子 有 : Univac 1100/94、Cary-XMP、Alliant/8 和 IBM 
3090/400 等 。 

分 布 式 存储 多 处 理 器 〈 松 耦合 ) ” 松 耦 合 MIMD 体 系 结构 由 连接 到 多 处 理 器 节点 的 分 布 式 
本 地 存储 器 组 成 。 比 较 流行 的 互联 拓扑 有 超 立 方 体 、 环 、 蝶 形 交 换 器 、 超 树 (HyperTree) 和 
超 网 (Hypernet) ( 见 第 1.3 节 )。 消 息 传递 是 处 理 器 之 间 的 主要 通信 方式 。 大 多 数 多 处 理 器 在 
设计 时 就 考虑 到 性 能 的 可 伸缩 性 。 松 耦合 多 处 理 器 的 例子 有 : DADO2、 哥 伦比 亚 大 学 的 Non- 
Von、Cosmic Cube、Ametec 2010 系 列 、Intel 个 人 超级 计算 机 (Intel Personal Supercomputer)、 
Ncube/10、Lawrence Snyder 的 可 配置 高 度 并 行 计 算 机 (Configurable Highly Parallel 
Computer, CHIP ) 和 Howard Siegel 的 可 划分 SIMD/MIMD 系 统 (Partitionable SIMD/MIMD 
System, Pasm ) 等 。 

基于 MIMD 体 系 结构 的 变形 ”MIMD/SIMD 混 合 、 数 据 流 体系 结构 、 归 约 机 和 波 前 阵列 处 
理 器 等 都 给 Flynn 有 条 理 的 分 类 造成 困难 。 例 如 ， 所 有 这 些 结构 类 型 都 有 MIMD 体 系 结构 的 异 
步 执行 和 对 多 指令 流 及 数据 流 并 发 操作 的 特征 。 然 而 ， 它 们 也 有 别 于 MIMD 体 系 结构 的 设计 
原则 。 因 此 ， 这 些 体 系 结构 都 被 归 为 “基于 MIMD 体 系 结构 的 变形 ”中 ， 既 突出 它们 与 MIMD 
的 不 同 基础 特点 ， 也 说 明 它 们 与 MIMD 的 共同 特点 。 

MIMD/SIMD 体 系 结构 选择 了 部 分 MIMD 体 系 结构 并 以 SIMD 的 方式 进行 控制 。 可 重 构 体 
系 结构 和 控制 SIMD 执 行 的 实现 机 制 是 很 不 相同 的 。 比 较 流行 的 实现 方式 是 采用 树 形 结构 的 消 
息 传 递 计算 机 作为 基本 结构 。MIMD/SIMD 机 器 的 例子 有 DADO、Non-Van、Pasm 和 Texas 可 
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重 构 阵 列 计算 机 (Texas Reconfigurable Array Computer, TRAC )。 

数据 流体 系 结构 的 基本 特点 是 一 旦 指令 的 所 有 操作 数 可 用 就 可 执行 指令 。 因 而 指令 的 执行 
顺序 基于 数据 相关 性 ， 从 而 使 得 数据 流体 系 结构 能 够 发 抉 任务、 子 程序 和 指令 级 别 上 的 并 发 
性 。 数 据 流 体系 结构 的 主要 目的 是 开发 新 的 计算 模型 和 语言 来 实现 大 规模 的 并 行 性 。 一 些 著 
名 的 数据 流 计算 机 有 曼彻斯特 DataFlow Computer、MIT Tagged Token DataFlow architecture 和 
LAU System。 

归 约 (或 需求 驱动 ) 机 ”这 类 机 器 实现 的 执行 环境 是 当 某 个 指令 的 计算 结果 被 另外 一 个 
谁 备 执行 的 指令 用 作 操 作 数 时 ， 就 执行 该 指令 。 归 约 机 运行 的 程序 由 幢 套 的 表达 式 组 成 。 表 
达 式 被 递归 定义 为 以 文字 表达 式 为 参数 的 文字 或 函数 。 实 现 归 约 机 要 解决 的 问题 包括 指令 执 
行 结果 的 同步 需求 和 维持 表达 式 演化 的 结果 。 归 约 机 的 例子 有 Newcastle 归 约 机 、 北 卡 罗 林 娜 
Cellular Tree Machine、 犹 他 Applicative Multiprocessing System 等 。 | 

波 前 处 理 器 阵列 ”此 类 处 理 器 阵列 把 脉动 数据 流水 线 和 异步 数据 流 执行 语义 结合 在 一 起 。 
S.YKung 于 20 世 纪 80 年 代 早期 提出 了 这 一 概念 。 这 激发 了 脉动 阵列 的 研究 设计 ， 可 以 为 利用 
高 VO 带宽 平衡 计算 密集 特殊 应 用 系统 提供 高 效 和 价 廉 物美 的 体系 结构 。 波 前 和 脉动 阵列 体系 
结构 都 具有 模块 化 处 理 器 和 本 地 的 常规 互联 网 络 的 特点 。 但 是 ， 波 前 阵列 用 协调 处 理 器 间 数 
据 传递 的 异步 担 手 机 制 取 代 了 用 在 同步 脉动 数据 流水 线 中 的 全 局 时 钟 和 显 式 时 间 延 迟 。 担 手 
机 制 允 许 计 算 波 前 以 阵列 的 处 理 器 为 波 传播 介质 平滑 地 通过 阵列 而 不 相交 。Kung 认 为 波 前 阵 
列 与 脉动 阵列 相 比 具有 更 大 的 可 扩展 性 、 更 简单 的 程序 设计 和 更 强 的 容错 能 力 等 特点 。 约 翰 
霍 普 金 斯 大 学 、 斯 坦 福 Telecommunication、Royal Signal 和 Rader Establishment (英国 ) 都 建 
造 了 波 前 处 理 器 阵列 。 


1.3 并 行 计算 模型 


任何 并 行 算法 的 设计 都 是 基于 并 行 计算 机 体系 结构 假设 基础 上 的 ， 这 就 是 并 行 计算 模型 。 
很 多 研究 者 提出 了 许多 不 同 的 设计 并 行 算法 的 计算 模型 。 本 节 介 绍 其 中 几 个 重要 的 。 


1.3.1 二 又 树 模型 


在 这 一 模型 中 ， 整 个 问题 的 处 理 以 二 叉 树 的 形式 表示 ， 其 中 每 个 非 叶 节点 都 有 两 个 子 节 
点 。( 二叉树 的 正式 定义 见 第 2 章 ) 每 个 非 叶 节点 代表 一 个 操作 。 在 同一 层 的 所 有 操作 可 以 并 
行 执行 。 二 叉 树 模型 有 时 也 叫做 有 向 无 环 图 (Directed Acyclic Graph，DAG ) 模型 。 

假定 我 们 想 求 8 个 数 的 和 。 我 们 必须 画 一 个 以 这 8 个 数 为 叶子 的 最 小 高 度 的 二 又 树 。 二 又 
树 的 内 部 节点 代表 两 个 子 节点 值 的 相 加 操作 。 图 1-7 说 明了 这 一 过 程 。 假 定 有 4 个 可 用 的 处 理 
器 。 现 在 可 以 调度 这 些 处 理 器 来 完成 内 部 节点 所 代表 的 操作 。 调 度 一 般 是 函数 SCH ， 它 给 每 
个 内 部 节点 指定 一 个 有 序 对 (p, ?) ， 其 中 p 代 表 处 理 器 数目 ，! 代 表 操作 发 生 的 时 间 。 图 1-7 中 的 
内 部 节点 已 经 被 标 上 了 有 序 的 数字 1，2，3，4，5，6 和 7。 








如 下 是 一 个 调度 函数 ; 
调 度 含 义 
SCH(1)= (1, 1) 在 时 间 1 处 理 器 1 执行 
SCH(2) = (2, 1) 在 时 间 1 处 理 器 2 执行 


SCH(3) = (3, 1) 在 时 间 1 处 理 器 3 执行 
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( 续 ) 
调 度 含 义 
SCH(4) = (4, 1) 在 时 间 1 处 理 器 4 执行 
SCH(5) = (1, 2) 在 时 间 2 处 理 器 1 执行 
SCH(6) = (2, 2) 在 时 间 2 处 理 器 2 执行 
SCHO) = (1, 3) 在 时 间 3 处 理 器 1 执行 





图 1-7 相 加 算法 的 调度 


这 里 8 个 数 相 加 的 任务 已 经 被 4 个 处 理 器 在 3 个 单位 时 间 内 完成 了 。 有 n 个 节点 的 完全 二 又 
树 的 高 度 是 log ma， 因 此 用 m/2 个 处 理 器 相 加 ?个 数 的 任务 可 以 在 log n 个 单位 时 间 内 完成 。 

这 意味 着 在 ! = 0 到 := 1 的 时 间 间 隔 内 ， 下 列 任务 可 以 同时 执行 : 

处 理 器 1 执行 4 + A;; 

处 理 器 2 执行 A; + 44; 

处 理 器 3 执行 A; + 46 

处 理 器 4 执行 A1 + A。。 

现在 我 们 获得 了 (4 + 4)，(4 + 41),，(hs+ 4) 和 (41+ 4) 的 值 。 而 在 t= 1 到 t =2 的 
时 间 间 隔 内 ， 下 列 任务 可 以 同时 执行 : 

处 理 器 1 执行 (4 + A,) + (hs +A); 

处 理 器 2 执行 (hs + As) + 〈4 + 4:)。 

这 样 我 们 就 得 到 了 (4 + 4; + A;+ 44) 和 (4s+ hs+ 4+ hs) 的 值 。 在 := 2 到 t= 3 的 时 间 
间隔 内 ， 处 理 器 1 完成 (4 + 4 + 4 + 4) 和 (A; + 4s+ 4 + 4s) 相 加 的 任务 。 整 个 任务 按照 
下 式 表示 的 过 程 执行 : 

{(4, + Ai) + (A;s+ A)} + {(As +A)+(4 + A)} 


假定 只 有 1 个 处 理 器 可 用 。 在 这 种 情况 下 ， 整 个 计算 过 程 可 以 用 图 1-8 中 给 出 的 斜 树 表示 。 
相应 的 调度 函数 值 也 在 每 个 内 部 节点 旁边 给 出 。 在 此 情况 下 需要 7 个 单位 时 间 。 而 要 把 x 个 数 
相 加 需要 -1 个 单位 时 间 。 

当 只 有 3 个 处 理 器 时 ， 对 8 个 数 相 加 的 二 又 树 模型 如 图 1-9 所 示 。 这 时 需要 4 个 单位 时 间 。 

由 于 定义 调度 函数 很 烦琐 ， 在 并 行 计算 中 二 又 树 模 型 并 不 常用 。 
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图 1-9 用 3 个 处 理 器 求 和 


1.3.2 网 络 模型 


当 需 要 并 行 化 时 ， 很 自然 要 用 到 多 个 处 理 器 。 我 们 假定 这 些 处 理 器 独立 工作 并 能 相互 通 
信 。 为 了 通信 ， 这 些 处 理 器 必须 用 物理 的 链 路 相连 接 。 这 类 模型 叫做 网 络 模型 或 直 连 机 器 。 
在 网 络 模型 中 ， 几 个 处 理 器 通过 物理 链 路 互相 连接 ， 并 有 如 下 六 个 假设 : 

1. 每 个 处 理 器 都 有 一 个 相 联 大 存储 器 ， 即 处 理 器 的 本 地 存储 器 。 处 理 器 的 程序 以 及 输入 
输出 值 都 存放 在 存储 器 中 ; 

2. 不 存在 所 有 处 理 器 都 能 访问 的 公用 存储 器 ; 

3. 处 理 器 之 间 直 接 用 物理 链 路 连接 ， 互 连 拓 扑 称 做 网 络 拓 扑 。 网 络 拓 扑 是 一 个 以 处 理 器 
为 顶点 ， 以 互 连 为 边 的 图 。 链 路 可 以 是 单 向 的 或 者 双向 的 ; 

4. 如 果 两 个 处 理 器 相 邻 那么 数据 可 以 直接 从 一 个 处 理 器 传送 到 另外 一 个 ; 

5. 在 一 个 时 钟 周期 内 ， 任 一 个 处 理 器 执行 一 步 单位 操作 ; 

6. 处 理 器 可 以 在 单位 时 间 内 把 数据 传递 到 它 相 邻 的 处 理 器 中 。 

当 为 一 个 网 络 模型 系统 设计 算法 时 ， 必 须 首 先 指定 如 下 内 容 : 

1. 网 络 拓扑 ; 

2. 输入 配置 ; 

3. 输出 配置 。 
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网 络 拓 扑 ”遗憾 的 是 , 不 存在 对 所 有 问题 都 合适 的 理想 通用 拓扑 。 因 此 我 们 必须 调查 问题 ， 
然后 提出 互 连 拓 扑 。 它 可 以 是 任意 的 图 、 环 、 树 、 立 方 体 等 。 

输入 配置 ”针对 特定 网 络 拓扑 而 设计 的 求解 特定 问题 的 算法 中 ， 输 入 必须 在 各 处 理 器 进 
行 分 布 。 我 们 称 此 为 输入 配置 。 

输出 配置 ”输出 结果 在 各 处 理 器 的 分 布 ， 称 为 输出 配置 。 

下 面 将 研究 用 于 求解 一 些 有 趣 问题 的 网 络 拓扑 。 我 们 从 最 流行 的 拓扑 一 一 超 立方 体 开 始 。 


1.3.3 超 立方 体 〈(k- 立 方 体 ) 


首先 用 递归 的 方式 来 定义 立方 体 。0- 立 方 体 表示 单个 处 理 器 。I- 立 方 体 表示 两 个 相互 连 
接 的 处 理 器 。2- 立 方 体 表示 4 个 处 理 器 为 顶点 组 成 的 正方 形 处 理 器 网 络 。2- 立 方 体 可 以 通过 两 
个 1- 立 方 体 构建 ， 即 把 Po-P1 和 P,-P; 两 个 1- 立 方 体 的 Po 和 P,，P, 和 P; 连接。 如 图 1-10 所 示 。 一 
个 3- 立 方 体 由 一 对 2- 立 方 体 组 成 ， 

PiPPP 和 PP:PeP， 


而 且 需 要 在 如 下 节点 间 建 立 连 接 : 
Pip, 
P' 到 P; 
P,2IP, 
Ps 到 P, 
Po Pp 
Pa Ps 
图 1-10 2- 立方体 
图 1-11 画 出 了 一 个 3- 立 方 体 (目前 可 以 忽略 节点 上 的 标识 )。 通 常 ， 大 立方体 可 以 定义 为 
一 对 (k--1)- 立 方 体 通 过 在 相应 的 节点 建立 连接 而 形成 。&k- 立 方 体 也 可 以 称 为 k 维 超 立 方 体 。 





图 1-11 3- 立 方 体 
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以 上 对 大 立方 体 的 定义 就 是 递归 方式 的 。 一 个 大 立方 体 包含 2 个 节点 ， 且 用 Kk 位 的 二 进 制 数 
标识 。 两 个 节点 的 二 进 制 标识 当 且 仅 当 有 1 位 不 同时 ， 这 两 个 节点 用 一 条 边 相连 接 。 例 如 ，3- 
立方 体 包 含 8 个 节点 ， 且 分 别 标识 为 000、001、010、011、100、101、110、111。 一 般 ， 任 一 
节点 《5b:b;…bi) 通过 边 与 下 述 k 个 节点 连接 (其 中 的 如 表示 对 该 位 取 反 ，i = 1,2,…,): 

bbb,…b, 
bibsbs**b. 


bibsbs…b, 

例如 ， 在 3- 立 方 体 里 ，000 与 100、010 和 001 连 接 ; 001 与 101、011 和 000 连 接 ; 010 与 110、 
000 和 011 连 接 ; 100 与 000、110 和 101 连 接 ; 101 与 001、111 和 100 连 接 ; 110 与 010、100 和 111 
连接 ; 111 与 011、101 和 110 连 接 。 这 些 都 在 图 1-11 中 给 出 。 从 大 立方 体 的 定义 来 看 ， 我 们 可 以 
观察 到 如 下 的 属性 : 

属性 1 -立方 体 就 是 有 2 个 节点 的 x 正则 图 。k 正 则 图 是 每 个 节点 都 有 k 度 的 图 。 

属性 2 两 个 节点 a = (aa…ab 和 2 = (bb…b) 之 间 的 距离 是 a 和 4b 之 间 不 同 的 二 进 制 位 个 数 。 

例如 ， 在 5- 立 方 体 里 ，(11100) 和 (11011) 之 间 的 距离 是 3。 这 是 因为 它们 有 3 个 二 进 制 位 不 
同 。(11100) 与 (11000) 相 邻 ， 而 (11000) 与 (11010) 相 邻 ，(11010) 又 与 (11011) 相 邻 。 


Cm) Com Caoo7 uo) 


由 于 数据 可 以 在 单位 时 间 内 从 一 个 节点 传送 到 相 邻 节点 ， 那 么 从 节点 (11100) 到 (11010) 的 
传送 时 间 为 3 个 单位 。 

在 一 个 6- 立 方 体 中 ， 假 定 我 们 要 从 节点 Pz 传 送 数 据 到 Ps,， 并 有 (27)e = (011011): 和 (43)o = 
(101011),。 

这 两 个 节点 的 标识 有 两 位 不 同 。 所 以 ， 在 两 个 单位 时 间 内 我 们 可 以 把 数据 从 Pw 传送 到 P,。 
传送 的 路 径 通 过 匹配 相应 的 二 进 制 位 确定 : 

P» Ps Ps 
(011011) (111011) (101011) 

属性 3 在 一 个 具有 n 个 节点 的 超 立 方 体 (其 中 n = 2:) 中 ,数据 最 多 在 log; n 个 单位 时 间 内 
从 一 节点 传送 到 另 一 节点 。 这 是 由 于 属性 2 和 =” = 2* 隐 含 着 iog, n = Kk。 本 书 里 ， 由 于 只 处 理 底 
数 为 2 的 对 数 ， 我 们 简单 地 把 log: n 表 示 为 log n。 

属性 4 设 e( 旭 为 上 -立方 体 的 边 数 。 通 过 上 立方 体 的 递归 搭建 ， 我 们 有 如 下 的 递归 方程 : 

e(k) = 2e(k—1) + 24 


递归 带 入 e(k-1)， 就 有 : 
e(k) = 2(2e(k—2) + 277) + 24 
= 2? e(k-2) + 2:2"! 
= 2 e(k—3)+3. 2 
= 2 e(1) + (Kk—1)24» 
=2"1+(k-1)2"!  (e(1)=1) 
= Kk2*! 





如 果 n = 2: 是 kK- 立方体 的 节点 个 数 ， 就 有 : 


这 就 是 -立方 体 的 边 的 个 数 。 

当 n 个 节点 连接 成 完全 图 时 ， 有 n(n-1)/2 条 边 。 在 完全 图 里 ， 任 两 个 节点 都 是 相 邻 的 ， 从 一 
节点 到 另 一 节点 传送 数据 都 在 一 个 单位 时 间 内 。 但 这 需要 n(n-1)/2 条 边 才 能 实现 ， 而 这 么 多 条 
物理 链 路 的 开销 是 很 大 的 。 但 是 如 果 连 接 成 k- 立 方 体 ， 只 需要 (n/2)log n 条 边 ， 从 任 一 节点 到 其 
他 节点 数据 传送 需要 log n 个 单位 时 间 。 表 1-1 给 出 了 对 不 同 的 x，n(n-1)/2 和 (n/2) log n 相 应 的 值 。 


端点 个 数 n logn 
2 1 

4 2 

8 3 

16 4 

32 5 

64 6 

128 7 

1024 10 


表 1-1 也 表明 了 k- 立 方 体 拓扑 与 完全 图 相 比 较 下 的 经 济 优势 。 下 面 我 们 解释 如 何 为 直 连 网 
络 中 的 k- 立 方 体 拓扑 设计 算法 。 现 在 设计 一 个 算法 从 有 n 个 元 素 的 数组 中 找 出 最 小 的 元 素 。 


假定 该 数组 表示 为 : 


下 面 给 出 简单 的 串 行 算法 : 


BEGIN 
small = ao 
Fori=1ton-l do 
If small > a, then 
small = a,; 
endif 
edfor 
END 


此 串 行 算法 需要 OU 的 时 间 。 我 们 采用 大 立方 体 连 接 网 络 的 处 理 器 来 设计 一 个 时 间 复 杂 度 


e(k) = Kk27 = (log n)n/2 


表 1-1 k- 立 方 体 和 完全 图 的 比较 


完全 图 的 边 数 n(n-1)/2 
1 
6 
28 
120 
496 
2016 
8128 
523776 
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为 O(log n) 的 算法 ， 从 输入 配置 开始 : 


输入 配置 “把 "个 数 分 配给 nx 个 处 理 器 。 为 了 方便 ， 假 定 ” = 2*。 开 始 时 a 位 于 处 理 器 PA0 < 


i n-1) 的 本 地 内 存 中 。 这 在 图 1-12 中 给 出 。 


输出 配置 ”要求 最 终 的 结果 (数组 的 最 小 元 素 ) 存储 在 Po 中 。 
执行 过 程 充分 利用 k- 立 方 体 是 一 对 (kK-1)- 立 方 体 的 定义 ， 把 P, 与 P.: 相 连接 。 现 在 传送 P., 
处 理 器 中 的 内 容 到 P,(0 < i< 2"')。 处 理 器 Po 中 存 有 a。 和 a,。 相 似 的 ，P; 中 存 有 a, 和 a,。 每 个 处 


理 器 P 都 比较 a; 和 a,;， 并 把 较 小 值 存在 a; 中 。 在 此 过 程 之 后 ， 景 小 的 数 存在 下 面 数 组 之 中 : 


CoG1G2 Go2)-1 
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大 立方 体 的 边 数 (w/2) log n 
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图 1-12 输入 配置 


在 由 处 理 器 PoP,…P, ,组 成 的 (k~1)- 立 方 体 上 重复 此 过 程 ， 最 小 的 数 存 储 在 数组 中 。 
重复 过 程 x 次 ， 最 小 的 元 素 到 达 节 点 P。。 以 包含 15，10，20，9，8，7，21 和 5 这 8 个 元 素 
的 数组 为 例 ， 此 过 程 在 图 1-13a 到 图 1-13g 中 给 出 。 


Po 








b) 


图 1-13 
a) 数组 元 素 的 初始 位 置 b) 已 从 处 理 器 Pa(0 < i< 3) 接 收 数组 元 素 4， 并 存 为 b， 
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8) 


图 1-13 ( 续 ) 
c) 对 每 个 处 理 器 P (0 < i< 3)， 执 行 操作 a, = Minf{a, b,}。 此 图 表示 了 在 进行 操作 
之 后 的 co, ca, az a; 的 值 d) 处 理 器 P, (0 < i< 1) 从 处 理 器 P;,, 接 收 数组 元 素 a,， 
e) 对 i = 0, 1， 在 执行 a, = Min{a, &;} 操 作 之 后 处 理 器 上 的 内 容 
f) 处 理 器 P, 发 送 a, 到 P。 g) ao = Min{ao, bo} 


上 述 算法 可 以 形式 化 描述 如 下 : 

算法 k-CUBE-Min 

输入 : 每 个 处 理 器 P, 都 在 本 地 内 存 中 包含 有 数组 元 素 a; (0 < i< n-1)。 假 定 n = 2: 
输出 : 数组 ao, a,…, a,, 的 最 小 元 素 存 和 人 变 量 a。 
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BEGIN 
.FOR 4 =K-1to lstep ~l1 do 
.111 二 24 
.Fori=0 tom-l do in parallel 


. Processor 已 ,。 Send data ain to processor 已 


1 
2 
3 
4 
5. Processor 已 : Receive data Cn sent by processor pi and store in the local memory as b, 
6.9=Min {a b,} 
7., end parallel 
8. end for 

END 

由 于 存在 for 循 环 (第 1 ~ 8 步 )， 此 算法 的 时 间 复 杂 度 是 O(k)， 即 O(log n)。 在 上 述 过 程 中 ， 
第 4 步 和 第 5 步 描述 从 一 个 处 理 器 到 另外 一 个 的 通信 。 通 信 的 时 间 与 处 理 操作 的 时 间 相 比 通常 
很 长 。 因 此 ， 上 述 算法 不 会 有 很 高 的 效率 。 

接 下 来 将 研究 并 行 计算 中 用 到 的 更 多 的 网 络 拓扑 。 虽 然 网 络 模型 不 是 本 书 关心 的 主要 内 
容 ， 但 为 了 完整 性 ， 我 们 给 出 这 些 内 容 。 


1.3.4 网 格 网 络 


处 理 器 以 网 格 的 形式 排列 称 做 同 格 网 络 。 图 1-14 给 出 了 一 个 二 维 网 格 。 三 维 网 格 由 二 维 
网 格 的 集合 组 成 ， 其 中 相应 的 处 理 器 相连 接 。 相 似 地 ， 任 意 六 维 网 格 都 是 (-1)- 维 网 格 的 集合 
且 相 应 的 处 理 器 能 够 相互 通信 。 





图 1-14 二 维 网 格 


1.3.5 金字 塔 网 络 


金字 塔 网 络 与 有 根 树 的 构建 方式 相似 。 网 络 的 根 包 含 1 个 处 理 器 。 在 其 第 2 层 有 4 个 处 理 器 
以 二 维 网 格 的 形式 排列 ， 且 这 4 个 都 是 根 处 理 器 的 子 处 理 器 。 第 1 层 的 4 个 节点 每 个 都 在 第 2 层 
有 4 个 子 节点 。 所 有 在 第 2 层 的 节点 都 以 网 格 的 形式 排列 。 相 似 地 ， 金 字 塔 网 络 可 以 构建 到 任 
意 高 度 。 图 1-15 给 出 的 是 高 度 为 2 的 金字 塔 网 络 。 
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图 1-15 大 小 为 16 的 金字 塔 网 络 


1.3.6 星 形 图 


大 立方体 被 定义 为 标识 成 0 到 2 (用 二 进 制 数 表示 ) 的 2 个 节点 的 集合 ， 当 且 仅 当 两 个 节 
点 的 二 进 制 表示 有 1 位 不 同时 ， 二 者 用 一 条 边 相 连 。 图 1-11 给 出 了 3- 立 方 体 的 二 进 制 标识 。 上 
述 定 义 启 发 研究 者 对 星 形 图 作 如 下 定义 : 假定 是 正 整数 ， 考 察 k 个 符号 的 置换 。 对 k 个 符号 ， 
有 Kk 个 置换 。 相 应 于 Kk 个 置换 可 以 定义 k 个 节点 。 当 且 仅 当 两 节点 相应 排列 最 左 位 和 任意 一 个 其 
他 位 置 不 同时 ， 这 两 个 节点 相 邻 。 由 此 得 到 的 图 被 称 做 k- 星 形 图 。 以 k = 3 为 例 。 在 这 种 情况 
下 ， 有 六 个 置换 : 

Po=(1,23) 已 =(132) 已 =(2.13) 
Pi=(2,3,1)) P=(3,1,2) Pi=(3.2.) 


可 简写 为 : 
P,= 1,2,3 
1,2,3 
即 P,(1) = 1, Pu(2) = 2 和 Po(3) = 3。 [41 | 
P= 1,2,3 
1,32 


即 P.(1) = 1, P,(2) = 3 和 P.(3) = 2。 
相应 的 3- 星 形 图 在 图 1-16 给 出 。 星 形 图 也 可 以 用 递归 的 方式 定义 为 为 了 构建 k- 星 形 图 ， 
考虑 有 k 份 (k-1)- 星 形 图 。 在 任 一 个 (1)- 星 形 图 中 ， 每 个 顶点 都 用 -1 个 符号 的 置换 标识 。 我 们 
用 5,, 5,, …, 5, 表示 这 k 份 (k-1)- 星 形 图 ， 用 除 之 外 1 到 k 的 符号 的 置换 标识 5, (1 < i< 记 的 顶点 。 
即 $, 的 每 个 顶点 用 符号 2, 3, 4,…, k 的 置换 标识 ; 5; 的 顶点 用 符号 1, 3, 4,…, 的 置换 标识 。 相 似 
地 ， 其 他 图 也 用 这 类 方式 标识 。 然 后 在 图 5; 每 个 顶点 置换 的 最 右边 加 入 符号 i， 并 生成 如 下 的 
新 边 : 当 且 仅 当 一 个 置换 可 以 通过 交换 另外 一 个 置换 的 第 -一 个 和 最 后 一 个 符号 得 到 时 ， 这 两 
个 顶点 4 和 B 相 连 。Day 和 Tripathi(1991) 已 经 研究 了 大 -立方 体 和 k- 星 形 图 的 拓扑 性 质 。 下 表 给 出 [和 旬 ] 
了 这 两 种 拓扑 的 基本 参数 。 
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性 质 大 立方 体 - 星 形 图 
顶点 数 2k 天 
度 天 人 -1 
直径 大 3/2(k-1) 
Po = (1,2,3) 
Ps = (3,2,3) Pp, = (2,1,3) 
Ps=(2,3,1) Ps =(3,1,2) 
P = (1,3,2) 
图 1-16 3- 星 形 图 


Day 和 Tripathi(1992) 提 出 了 另外 一 种 互 连 拓扑 称 做 排列 图 (Arrangement Graph) ， 是 是 形 
图 的 推广 。 他 们 证 明了 排列 图 在 选择 如 度 、 直 径 和 顶点 数 等 主要 参数 时 比 星 形 图 更 具有 灵活 
性 。 任 何 一 个 星 形 图 都 是 排列 图 。Day 和 Tripathi(1993) 提出 了 对 k- 星 形 图 的 边 指 定 方向 的 方 
法 ， 并 推出 了 k- 星 形 图 的 几 个 有 趣 的 性 质 。 : 


1.4 PRAM 模 型 


在 直 连 网 络 里 ， 处 理 器 之 间 是 通过 物理 链 路 直接 连接 的 。 而 在 PRAM (Parallel Random 
Access Machine ) 模型 里 ， 所 有 的 处 理 器 都 与 全 局 大 内 存 连 接 并 且 共 享 此 内 存 。 如 图 1-17 所 示 ， 
这 一 模型 也 称 作 共享 存储 器 模型 。 假 定 所 有 处 理 器 通过 公用 时 钟 同步 运行 。 每 个 处 理 器 都 能 
访问 ( 读 / 写 ) 整个 内 存 。 处 理 器 间 的 通信 仅 通 过 共享 内 存 实现 ， 即 从 处 理 器 P; 发 出 的 数据 通 
过 如 下 步骤 到 达 P;: 

1. 处 理 器 P; 把 数据 写 人 全 局 内 存 中 ; 

2. 处 理 器 忆 把 数据 从 全 局 内 存 中 读 出 。 





处 理 器 2 
图 1-17 PRAM 模 型 
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如 图 1-18 所 示 。 本 书 中 的 PRAM 模 型 都 以 Flynn 分 类 中 的 SIMD 模 型 方式 工作 。 但 是 有 公用 
内 存 的 SISD 和 MIMD 机 器 也 不 能 排除 。 在 PRAM 模 型 中 ， 根 据 多 个 处 理 器 对 一 个 存储 单元 读 / 
写 数 据 的 能 力 ， 可 以 有 四 种 不 同类 型 : 
1. 绝对 读 绝对 写 PRAM (EREW); 
2. 并 发 读 绝 对 写 PRAM (CREW); 
3. 绝对 读 并 发 写 PRAM (ERCW); 
4. 并 发 读 并 发 写 PRAM (CRCW)。 





图 1-18 
a) 处 理 器 P，b) 处 理 器 已 把 数据 写 人 全 局 内 存 
c) 处 理 器 忆 把 数据 从 全 局 内 存 中 读 出 


绝对 读 绝对 写 PRAM 模 型 同一 时 刻 只 允许 一 个 处 理 器 对 同一 存储 单元 读 / 写 ， 而 不 允许 多 
个 处 理 器 对 同一 个 存储 单元 同时 读 / 写 。CREW PRAM 模 型 允许 多 个 处 理 器 对 同一 存储 单元 并 
发 读 但 不 允许 并 发 写 。ERCW PRAM 模 型 只 允许 对 同一 存储 单元 并 发 写 。CRCW PRAM 模 型 
是 功能 最 强 的 模型 ， 允 许 对 同一 存储 单元 并 发 读 和 并 发 写 。 当 一 个 或 多 个 处 理 器 想 对 同一 存 
储 单元 并 发 读 的 时 候 ， 我 们 假定 所 有 的 处 理 器 都 会 成 功 。 然 而 ， 当 多 个 处 理 器 想 对 同一 存储 
单元 并 发 写 的 时 候 ， 必 须 对 由 此 引起 的 冲突 进行 妥善 处 理 。 目前 主要 有 三 种 解决 冲突 的 方法 : 
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1. 平等 冲突 解决 (Equality Conflict Resolution，ECR); 

2. 优先 权 冲 突 解决 (Priority Conflict Resolution ，PCR ); 

3. 任意 冲突 解决 (Arbitrary Conflict Resolution ，ACR) 。 

在 ECR 的 情况 下 ， 仅 当 所 有 的 处 理 器 对 间 一 存储 单元 写 的 内 容 一 样 时 ， 我 们 假定 所 有 的 
处 理 器 写 操作 成 功 。 在 PCR 的 情况 下 ， 假 定 每 个 处 理 器 都 有 其 优先 权 。 当 多 个 处 理 器 同时 对 
一 个 存储 单元 进行 写 操作 时 ， 有 具有 最 高 优先 权 的 处 理 器 成 功 。 在 ACR 的 情况 下 ， 假 定 在 并 发 
写 的 所 有 处 理 器 中 ,任意 一 个 处 理 器 都 可 能 成 功 。 

MIMD 机 器 中 的 每 个 处 理 器 都 有 自己 的 时 钟 且 各 处 理 器 异步 运行 。 每 个 处 理 器 都 是 拥有 
自己 本 地 内 存 的 独立 计算 机 ， 并 能 访问 全 局 内 存 。 每 个 处 理 器 称 作 一 个 处 理 单元 。 如 果 处 理 
单元 通过 中 心 转换 机 制 连接 到 全 局 内 存 ， 处 理 器 之 间 的 通信 就 不 会 占用 太 多 的 时 间 且 不 复杂 。 
此 类 MIMD 系 统称 为 紧 辜 合 MIMD 模 型 。 反 之 就 称 为 松 看 合 。 

至 此 所 提 到 的 并 行 体系 结构 有 其 内 在 的 缺陷 ， 关 注 特 定 的 体系 结构 并 不 能 深入 了 解 算 法 
的 逻辑 结构 。 这 样 把 算法 移植 到 不 同 的 体系 结构 会 变 得 困难 。 另 外 ， 异 步 并 行 的 计算 模型 实 
质 上 很 抽象 ， 这 也 使 得 对 算法 的 分 析 很 困难 。 因 此 ， 我 们 只 限于 讨论 同步 PRAM 模 型 。 在 介 
绍 了 本 书 所 有 算法 所 采用 的 PRAM 并 行 计 算 模型 之 后 ， 让 我 们 来 介绍 在 本 书 中 用 来 写 并 行 算 
法 的 语言 结构 。 


PRAM 





图 1-19 PRAM 的 模型 


并 行 算 法 的 语言 结构 
我 们 现在 定义 表示 算法 的 特定 符号 和 语法 。 冉 值 语句 的 格式 是 : 
Variable = expression 
上 式 对 表达 式 进 行 计算 并 把 结果 存 人 变量 中 。IF 语 句 有 如 下 格式 : 
lf cond then 


$) 
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$2 


Endif 
这 里 的 语法 cond 是 有 效 逻 辑 条 件 。 如 果 条 件 为 真 9 则 执行 s,， S52,°**, 否则 执行 s'， S12 o 
For 循 环 有 如 下 的 格式 : 
For variable = s to e step h 
8i 
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end for 
这 里 通过 设置 变量 集合 的 值 为 s, s+h, s + 2h,…, 重复 执行 语句 s,, s,,…, 直到 s+kh>e。 也 可 [461 
采用 如 下 格式 的 While 循环 : 
While cond do 
5 


$2 


end while 


只 要 条 件 cond 为 真 ， 就 不 断 重复 执行 语句 s,, s,,…。 用 For-in-Parallel 语 名 表示 并 行 执 行 。 
该 语句 可 以 写成 如 下 两 种 不 同 的 结构 : 
结构 1: 
For variable = 1 to n do in parallel 
3 


$2 


End parallel 
n 个 处 理 器 中 的 每 一 个 同时 执行 相同 的 指令 s,, 5,…。For 语 名 的 运行 变量 表示 处 理 器 的 下 标 。 
结构 2: 
For x ES do in parallel 
Si 


$2 


End parallel 
同样 地 ， 每 个 处 理 器 同时 执行 相同 的 指令 s,, 5,,…。 这 里 ， 同 时 运行 的 处 理 器 个 数 是 $ 中 元 素 
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的 个 数 。 
假定 x, y, z 是 存在 全 局 内 存 中 的 三 个 变量 ,把 
X = 了 十 7 
写成 并 行 算法 。 每 个 处 理 器 执行 如 下 操作 : 
1. 读 取 变量 y 的 内 容 ， 称 其 为 v,(v, 是 在 处 理 器 本 地 内 存 中 的 变量 ) ; 
2. 读 取 变量 z< 的 内 容 ， 称 其 为 v,(v, 是 在 处 理 器 本 地 内 存 中 的 变量 ) ; 
3. 六 =wm+m (是 在 处 理 器 本 地 内 存 中 的 变量 ) ; 
4. 把 的 值 写 人 全 局 变量 x。 
以 此 为 基础 ， 我 们 给 出 一 些 简单 的 并 行 算法 来 说 明 并 发 读 和 并 发 写 操作 。 


1.5 一 些 简单 算法 


考虑 求 取 存 储 在 数组 A(1:n) 中 的 n 个 值 的 布尔 与 (AND) 的 值 的 问题 。 我 们 想 要 计算 : 
RESULT = A(1)^A(2)^A(3)*…^A(n) 
一 个 O(n) 时 间 的 串 行 算法 如 下 : 
BEGIN 
RESULT = .TRUE. 
Fori=1tondo 
RESULT = RESULT^A(G) 
End For 
END 
假定 采用 任意 冲突 解决 (ACR) 的 ERCW PRAM 模 型 。A(1:n) 是 一 个 布尔 值 的 数组 ， 我 们 要 计算 : 
RESULT = .FALSE.， 当 任意 一 个 值 4(i) 为 FALSE。 否 则 ， 
= .TRUE. 
假定 RESULT 作 为 全 局 变量 初始 时 为 .TRUE. 值 。 我 们 想 要 占用 n 个 处 理 器 ， 且 处 理 器 P; 从 
全 局 内 存 中 读 取 A4(i) 的 值 ， 并 检查 其 是 否 为 FALSE.。 如 果 A(i) = .FALSE.， 处 理 器 已 立即 在 全 
局 变量 RESULT 中 写 信 .FALSE.。 由 于 n 个 处 理 器 并 行 运行 ， 因 此 任务 可 以 在 单位 时 间 内 完成 。 
如 果 有 多 个 4(D 值 为 FALSE.， 则 有 多 个 处 理 器 并 发 地 对 全 局 变量 RESULT 写 入 值 .FALSE.。 这 
可 以 通过 任意 冲突 解决 (ACR) 来 处 理 。 如 果 所 有 的 4A(i) 值 都 为 .TRUE.， 那 就 没有 处 理 器 想 
要 对 RESULT 写 入 ， 其 初始 值 .TRUE. 仍 然 保 持 。 
我 们 正式 给 出 运行 在 采用 ACR 的 ERCR PRAM 模 型 里 的 并 行 算法 : 
算法 Boolean-AND 
输入 : 布尔 数组 A4(1:n) 
输出 : 布尔 值 RESULT 
BEGIN 
RESULT = TRUE 
For i= 1 to n do in parallel If A(i) = .FALSE. 
then RESULT = .FALSE. endif 
END 
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在 上 述 算法 中 ，O(n) 处 理 器 在 O(1) 时 间 内 完成 所 有 任务 。 可 以 看 出 ， 采 用 三 种 并 发 写 冲 
突 解决 类 型 (ECR ，PCR 或 ACR ) 的 任何 一 个 ， 上 述 算法 都 可 以 得 到 正确 结果 。 
在 ERCW-ECR 模 型 中 ， 对 同一 问题 考虑 如 下 算法 : 
算法 Boolean-AND-1 
输入 : 布尔 数组 A(1:n) 
输出 : 布尔 值 RESULT 
BEGIN 
RESULT = .FALSE. 
For i= 1 to n do in parallel 
RESULT = A() 
End Parallel 
END 


这 里 x 个 处 理 器 中 的 每 一 个 都 试图 把 4(i) 的 值 写 信 RESULT 中 。 和 如果 冲 突 解决 模型 是 
ERCW-ACR 类 型 ， 将 不 能 得 到 正确 结果 。 仅 当 PRAM 模 型 是 ERCW-ECR 类 型 时 上 述 算法 将 正 
确 给 出 RESULT 值 。 我 们 接 下 来 设计 能 在 EREW PRAM 模 型 中 处 理 同一 问题 的 算法 。 

基本 “与 ”操作 是 二 元 操作 ， 因 此 ， 一 个 处 理 器 一 次 只 能 对 两 个 数 执行 “与 ”操作 。 当 
数据 个 数 为 x 的 时 候 ， 需 要 n/2 个 处 理 器 。 这 /2 个 处 理 器 每 个 从 n 个 数据 分 得 2 个 数据 并 同时 执 
行 “ 与 ”操作 。 此 时 ， 得 到 的 mw/2 个 结果 作为 数据 重复 上 述 过程 ， 得 到 mw4 个 结果 。 按 上 述 方式 
重复 ， 在 O(log 门 时 间 内 将 得 到 最 后 结果 。 例 如 ， 如 果 有 8 个 数 4(1:8)， 第 一 步 执行 如 下 操作 : 

处 理 器 已 : 4(D)~ 4(1)^A4(2) ”处 理 器 P, : A(2) A(3)^A(4) 

处 理 器 P, : 4(3) 一 4(5)^4(6) ”处 理 器 已 : 4(4) A(7)^A(8) 

一 般 地 ， 处 理 器 P; 执行 A(i) 一 A(2i-1)^4(2i)。 这 样 就 可 以 通过 计算 4A(1)^4(2)^4(3)^4(4) 得 
到 最 后 结果 。 两 个 处 理 器 也 可 以 用 同样 的 方法 来 计算 。 处 理 器 已 执行 4(D)^4(2) 并 存 和 人 4(1); 
处 理 器 P, 执 行 4(3)^4(4) 并 存 人 A4(2)。 这 样 可 以 通过 计算 4(1)^4(2) 得 到 最 后 结果 。 现 在 正式 给 
出 这 一 算法 : 

算法 Boolean-AND-2 

输入 : 布尔 值 4(1:n) 

输出 : RESULT 

p = number of processors used. 
BEGIN 
p=n/2 
Whilep>0 do 
For i = 1 to p do in parallel 
A(i) = A(Q2i-1)4(2D) 
End Parallel 
p= [P/2] 
End while 
RESULT 
END 
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当 n=8 时 ， 此 算法 的 执行 过 程 如 图 1-20 所 示 。 其 中 的 while 循 环 需 要 重复 执行 log n 次 ， 因 
此 此 算法 的 时 间 复 杂 度 为 O(log n)。 在 EREW PRAM 模 型 中 需要 n/2 个 处 理 器 。 


p=1 
stage=3 





图 1-20 n=8 时 的 Boolean-AND-2 算 法 


1.6 并 行 算法 的 性 能 


并 行 算法 的 性 能 主要 通过 下 列 三 个 因素 评价 : 
1. 计算 时 间 (时 间 复 杂 度 ) ; 

2. 所 需要 的 处 理 器 个 数 (处 理 器 复杂 度 ) ; 
3. 所 需要 的 机 器 模型 。 

例如 ， 我 们 在 1.5 节 给 出 的 算法 的 性 能 如 下 表 : 





算 法 时 间 复 杂 度 处 理 器 复杂 度 PRAM 模 型 
Boolean-AND 0(1) O(n) ERCW 
Boolean-AND-1 0O(1) O(n) ERCW-ECR 
Boolean-AND-2 O(log; n) O(n) EREW 


用 常见 符号 表示 的 复杂 度 界限 定义 如 下 : 
1. 如 果 存 在 正 数 c 和 n。， 且 对 所 有 的 n>n。， 有 Tln) < cAhn)， 那 么 Tl(n) = OUWD); 
2. 如 果 存 在 正 的 常数 c 和 n。， 且 对 所 有 的 n>n。， 有 T(n) > cKn)， 那 么 T(n) = 人 20n)); 
3. 如 果 存 在 正 的 常数 c, cx, tm。 和 nn,， 且 对 所 有 的 n>n。， 有 T(n) < c, An); 对 所 有 的 n>n,， 有 
T(n)>c; ftn)， 那 么 T(n) = (fn))。 
即 如 果 T(n) = On))， 且 T(r) = QCAn))， 那 么 T(n) = 0(ftn))。 还 有 两 个 用 于 分 析 并 行 算法 
性 能 的 量 是 加 速 比 (speedup) 和 效率 (efficiency)。 
加 速 比 和 效率 “考虑 一 个 已 知 最 好 的 串 行 算法 的 问题 ， 其 时 间 复 杂 度 为 7.。 我 们 有 一 个 针 
对 相同 问题 的 并 行 算法 ， 其 时 间 复 杂 度 为 7, 和 处 理 器 复杂 度 P。 我 们 定义 
加 速 比 = /7 
效率 = T./PT, 
加 速 比 最 大 不 超过 处 理 器 个 数 ， 我 们 总 是 试图 开发 加 速 比 几乎 等 于 处 理 器 数目 的 并 行 算法 。 
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实际 上 ， 只 有 很 有 限 问 题 的 加 速 比 能 达到 这 一 要 求 。 效 率 最 大 为 1， 它 表明 所 有 处 理 器 的 有 效 
利用 率 。 

因为 想 要 知道 在 并 行 计算 机 上 运行 应 用 程序 的 速度 能 有 多 快 ， 并 行 领域 的 性 能 测量 变 得 
更 加 复杂 。 这 一 问题 也 可 以 说 成 我 们 利用 并 行 得 到 的 好 处 是 什么 。 通 常 依据 加 速 比 来 度量 : 

加 速 比 = 串 行 执行 时 间 / 并 行 执行 时 间 

串 行 和 并 行 执行 时 间 的 定义 有 多 种 方式 。 这 种 相 异 性 导致 有 五 种 不 同 的 加 速 比 定 义 ， 即 
相对 加 速 比 (relative speedup)、 实 际 加 速 比 (real speedup )、 绝 对 加 速 比 (absolute speedup )、 
渐 近 实际 加 速 比 (asymptotic real speedup) 和 渐 近 相对 加 速 比 (asymptotic relative speedup )。 
Sahni 和 Thanvantri 已 经 对 上 述 性 能 度量 进行 了 详细 地 研究 。 如 想 了 解 更 多 的 信息 ， 请 参见 参 
考 文献 Sahni [1997] and Thanvantri 。 

相对 加 速 比 ”这 里 串 行 时 间 定 义 为 运行 在 并 行 计算 机 的 单个 处 理 器 上 的 并 行程 序 的 执行 时 
间 。 因 此 ， 并 行 算法 A 在 用 p 个 处 理 器 解决 规模 为 x 的 问题 实例 P 时 的 相对 加 速 比 定义 为 : 
单个 处 理 器 用 算法 4 解决 问题 P 的 时 间 
P 个 处 理 器 用 算法 4 解决 问题 P 的 时 间 


并 行 系统 的 相对 加 速 比 并 不 是 固定 的 ， 它 依赖 于 问题 的 规模 2 和 处 理 器 的 个 数 。 相 对 加 
速 比 是 x 和 p 的 函数 。 固 定 *， 我 们 可 以 画 出 以 p 为 一 个 坐标 轴 ， 相 对 加 速 比 为 另外 一 个 坐标 轴 
的 相对 加 速 比 曲 线 。 这 可 以 用 于 在 处 理 器 数目 增加 时 分 析 算 法 的 性 能 。 相 似 地 ， 也 可 以 固定 
p， 画 出 以 为 一 个 坐标 轴 ，、 相 对 加 速 比 为 另外 一 个 坐标 轴 的 相对 加 速 比 曲线 。 这 可 以 用 于 在 
问题 规模 增加 时 分 析 算法 的 性 能 。 利 用 这 两 种 曲线 ， 我 们 可 以 找到 相对 加 速 比 的 最 大 点 ， 称 
做 最 大 相对 加 速 比 。 平 均 相 对 加 速 比 、 最 小 相对 加 速 比 和 期 望 相对 加 速 比 也 可 以 用 相似 的 方 

实际 加 速 比 在 这 一 度量 中 ， 并 行 执行 时 间 是 和 针对 应 用 的 最 快 串 行 算法 或 程序 所 需要 的 
时 间 相 比较 的 。 在 并 行 计算 机 单个 处 理 器 上 最 快 算法 的 执行 时 间 将 被 采用 。 由 于 对 很 多 应 用 
我 们 尚 不 知道 最 快 的 算法 ; 而 对 某 些 应 用 ， 不 存在 一 种 算法 对 所 有 情况 都 是 最 快 的 。 因 此 ， 
实际 使 用 的 串 行 算法 执行 时 间 被 用 来 代替 最 快 串 行 算法 的 执行 时 间 。 这 样 得 到 的 加 速 比 就 是 
实际 加 速 比 。 


Relative Speedup (n, p)= 


用 最 好 的 串 行 算法 解决 问题 的 时 间 

用 p 个 处 理 器 解决 问题 的 时 间 

我 们 可 以 像 相 对 加 速 比 那样 定义 最 大 实际 加 速 比 、 最 小 实际 加 速 比 、 平 均 实 际 加 速 比 、 
期 望 实际 加 速 比 等 。 

绝对 加 速 比 ”在 此 定义 中 ， 通 过 比较 并 行 执行 时 间 与 最 快 串 行 算法 在 最 快 的 串 行 计 算 机 上 
的 执行 时 间 得 到 加 速 比 。 就 像 实 际 加 速 比 那样 ， 实 际 上 我 们 是 用 “实际 ”使 用 的 串 行 算法 来 
完成 比较 。 


Real Speedup (n,p) = 


用 算法 A 和 和 p 个 处 理 器 解决 问题 的 时 间 
绝对 加 速 比 的 定义 可 以 扩展 到 最 大 绝对 加 速 比 、 最 小 绝对 加 速 比 、 平 均 绝对 加 速 比 等 。 
渐 近 实际 加 速 比 。 设 SC09) 为 针对 问题 的 最 好 革 行 算法 的 渐 近 复杂 度 ，P(o) 为 在 并 行 计 算 机 


Absolute Speedup (n,p)= 
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可 以 满足 所 需 处 理 器 的 假设 基础 上 并 行 算法 4 的 渐 近 复杂 度 。 渐 近 实 际 加 速 比 定义 为 : 
Asymptotic Real Speedup(n) = S(n)/P(n) 


对 于 像 排 序 之 类 的 渐 近 复杂 度 不 能 用 实例 规模 ”惟一 表征 的 问题 ， 我 们 采用 最 坏 情 况 下 的 
复杂 度 。 

渐 近 相对 加 速 比 ”此 加 速 比 和 渐 近 实际 加 速 比 的 不 同 点 在 于 串 行 复杂 度 ， 这 里 采用 在 单个 
处 理 器 上 运行 的 并 行 算法 的 渐 近 时 间 复 杂 度 。 

成 本 规范 化 加 速 比 除了 想 了 解 并 行 系统 的 运行 速度 之 外 ,通常 我 们 还 想 知道 获得 性 能 改 
进 所 需要 的 成 本 。 因 此 定义 成 本 规范 化 加 速 比 (cost normalized speedup ，CNS ) 如 下 : 


speedup (n,p) 
并 行 系统 的 成 本 / 串 行 系统 的 成 本 
为 了 得 到 成 本 规范 化 加 速 比 ， 我 们 需要 在 加 速 比 之 外 ， 得 到 并 行 系统 的 成 本 和 串 行 系统 
的 成 本 。 并 行 系统 的 成 本 包括 硬件 和 软件 的 成 本 。 还 要 考虑 是 否 包 括 维护 成 本 、 运 算 成 本 和 
保障 人 员 成 本 等 。 由 于 折扣 不 同 ， 每 次 购买 硬件 的 价格 都 会 不 同 。 一 年 前 购买 的 昂贵 系统 ， 
今天 可 能 花 很 少 的 钱 就 能 买 到 。 我 们 应 该 用 去 年 的 成 本 〈 即 我 们 实际 的 花费 )、 现 在 的 成 本 
( 即 替代 成 本 ) 还 是 明年 的 计划 成 本 〈 即 未 来 购买 该 系统 的 成 本 ) 呢 ? 另外 ， 并 行 系统 的 硬件 
所 支持 的 用 户 数 也 与 串 行 系统 不 同 ， 我 们 需要 对 用 户 的 硬件 成 本 进行 折旧 。 软 件 成 本 确定 起 
来 比较 困难 ， 除 非 购 买 的 是 标准 商品 软件 (这 在 并 行 计算 系统 中 不 太 可 能 ， 而 在 串 行 计算 系 
统 中 有 可 能 )。 而 且 ， 我 们 仍然 面临 采用 总 体 成 本 还 是 折旧 成 本 、 现 在 成 本 还 是 将 来 成 本 以 及 
维护 成 本 折旧 和 学 习 成 本 分 解 等 问题 。 串 行 系统 的 成 本 还 取决 于 所 采用 的 加 速 比 的 版 本 。 
此 ， 一 旦 知道 所 采用 的 加 速 比 版 本 ， 串 行 系统 就 很 好 定义 。 然 而 ， 实 际 确定 串 行 系统 的 成 本 
可 能 还 是 比较 困难 。 其 原因 与 并 行 系统 一 样 。 尽 管 成 本 规范 化 加 速 比 可 能 是 很 吸引 人 的 度量 ， 
但 由 于 确定 并 行 和 串 行 系统 的 成 本 比较 困难 ， 这 一 度量 不 被 广泛 采用 。 
效率 ”效率 是 和 加 速 比 关系 密切 的 性 能 尺度 。 它 是 加 速 比 和 处 理 器 个 数 p 的 比值 。 由 于 所 
采用 的 加 速 比 不 同 ， 可 以 得 到 不 同 的 效率 。 就 像 加 速 比 一 样 ， 效 率 不 应 该 脱离 运行 时 间 来 作 
为 性 能 尺度 。 具 体 原因 与 加 速 比 相同 。 
效率 的 一 些 赫 换 公 式 可 以 在 文献 中 找到 。 比 如 ， 有 些 作者 定义 效率 为 并 行 算法 完成 的 工 
作 (work accomplished，wa) 和 消耗 的 工作 (work expended，we) 之 间 的 比值 。 我 们 定义 
wa 为 “最 好 的 ”的 串 行 算法 所 完成 的 工作 ; we 为 并 行 执行 时 间 、 单 个 并 行 处 理 器 的 速度 s 和 处 
理 器 个 数 p 的 乘积 。 假 定 所 有 处 理 器 具有 相同 的 速度 ， 我 们 有 : 
we = 并 行 执行 时 间 xs xp 
wa = 最 好 的 串 行 执行 时 间 x s 
wa ”最 好 的 串 行 执行 时 间 
we ”px 并 行 执 行 时间 
此 效率 定义 等 于 实际 加 速 比 除 以 p。 因 此 ，wa/we 等 于 实际 效率 。 相 似 地 ， 如 果 wa 定 义 为 
并 行 算法 在 单个 处 理 器 上 执行 时 完成 的 工作 ， 则 wa/we 等 于 相对 效率 ( 即 相 对 加 速 比 除 以 p)。 
另外 一 个 等 价 的 效率 公式 根据 浪费 的 工作 (work wasted，ww 且 ww = we-wa) 来 定义 。 
可 以 写成 : 


CNS (n,p)= 
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wa wa 1 


we ww + wa 1 + ww/wa 


可 扩展 性 对 许多 并 行 系统 ( 即 并 行 算法 和 并 行 计算 机 的 结合 ) 来 说 ， 当 问题 规模 固定 时 ， 
加 速 比 会 随 着 处 理 器 数目 的 增加 而 降低 ; 当 处 理 器 数目 固定 时 ， 加 速 比 会 随 着 问题 规模 的 增 
加 而 上 升 。 并 行 系统 的 可 扩展 性 就 是 指 随 着 问题 规模 和 处 理 器 数目 的 增加 ， 并 行 系统 性 能 的 
改变 。 直 观 上 说 ， 如 果 系 统 的 性 能 能 够 随 着 系统 规模 (问题 规模 和 机 器 规模 ) 的 扩展 ( 即 增 
加 ) 而 不 断 提高 ， 则 此 并 行 系统 是 可 扩展 的 。 想 了 解 关于 可 扩展 性 的 详细 内 容 ， 请 参见 Sun 的 
文章 。 


1.7 小 结 


本 章 介 绍 并 行 的 概念 并 通过 足够 多 的 容易 且 合 适 的 例子 进行 解释 。 还 给 出 三 种 不 同 的 模 
型 。 由 于 本 书 的 主要 内 容 不 是 研究 二 又 树 或 网 络 模 型 ， 我 们 没有 对 它们 作 详 细 介 绍 。 对 
PRAM 模 型 我 们 给 出 了 必要 的 说 明 。 本 书 的 绝 大 多 数 算法 是 针对 PRAM 模 型 的 。 还 对 PRAM 模 
型 的 绝对 和 并 发 读 / 写 的 能 力作 了 介绍 。 对 于 并 发 写 模型 ， 为 了 解决 当 多 个 处 理 器 同时 对 一 个 
存储 单元 进行 写 时 的 冲突 ， 本 章 介 绍 了 三 种 不 同 的 方法 : ECR、PCR 和 ACR。 还 讨论 了 决定 
并 行 算法 性 能 的 因素 ， 并 对 加 速 比 和 效率 的 概念 作 了 解释 。 在 介绍 上 述 基 础 概念 的 同时 ， 也 
给 出 了 一 些 并 行 算法 作为 说 明 。 
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习题 


1.1 假定 最 多 有 五 个 处 理 器 可 以 并 行 工作 ， 请 画 出 下 列 计算 的 DAG 图 : 


10 


a) 4 放大 
1 10 
b) mean = 1 旋 志 


1.2 考虑 求 多 项 式 值 的 问题 : 
y=a0xX" taX 二 Go tAX +aX+ao 


假定 有 十 个 处 理 器 可 以 并 行 工作 ， 画 出 该 计算 的 二 叉 树 模型 。 


1.3 数值 x 起 初 存在 于 一 个 超 立 方 体 中 的 一 个 节点 。 请 给 出 一 个 算法 把 x 送 到 超 立 方 体 的 


所 有 其 他 节点 。 此 问题 称 为 消息 广播 问题 。 


1.6 


在 一 个 k 维 的 超 立 方 体 中 ， 有 2 个 数据 ， 每 个 节点 一 个 。 我 们 希望 重新 安排 数据 ， 使 
得 最 小 的 数 ;在 处 理 器 Po 中 ， 第 二 小 的 数 在 P, 中 ， 第 三 小 的 数 在 P, 中 ， 依 次 类 推 。 最 
大 的 数 最 后 一 定 在 P,_ ,中 ， 其 中 n = 2。 请 为 此 问题 设计 一 个 并 行 算法 。 
考察 数 组 A(0:n-1)， 对 于 数 x， 秩 (x:A) 是 数组 4 中 小 于 等 于 x 的 元 素 个 数 。 假 定数 组 
4(0:n-1) 存 在 于 超 立 方 体 中 ， 使 得 4; 在 处 理 器 已 (0<i<n) 中 。 处 理 器 Po 也 包含 一 个 
键 值 X。 请 设计 一 个 时 间 复 杂 度 为 O(log n) 的 算法 求 出 秩 (X:4)， 并 存储 在 Po 中 。 假 
定 n = 2*。 

超 立 方 体 中 的 每 一 个 处 理 器 P; 都 包含 一 个 数值 a,。 设 计 一 个 时 间 复 杂 度 为 0Uog n) 的 





算法 求 数组 w, a,, …, a,-, 的 平均 值 。 

1.7 什么 是 环 状 网 ? 它 的 直径 是 多 少 ? 

1.8 什么 是 弦 环 网 络 ? 请 解释 它 为 什么 比 普通 网 络 更 有 优势 。 

1.9 什么 是 Barrel Shifter 网 络 ? 请 画 出 一 个 有 15 个 节点 的 Barrel Shifter 网 络 。 

1.10 假定 4 是 一 个 n x ma 的 上 三 角 和 矩阵 。 求 解 方程 4X = B 的 回 代 方法 从 求解 最 后 一 个 方程 
at = b, 的 解 x, 开 始 ， 然 后 把 x, 代 入 前 面 的 方程 得 到 x,-,， 依 次 类 推 。 请 画 出 DAG 图 ， 
并 给 出 当 处 理 器 数目 p <n 上 时， 选择 特定 p 和 nn 的 调度 法 。 

1.11 在 有 个 处 理 器 的 超 立 方 体 上 ， 设 计 一 个 时 间 复 杂 度 为 0(n) 的 算法 计算 两 个 nx n 矩 
阵 的 乘积 。 

1.12 请 解释 立方 体 连接 环 网 络 这 一 概念 。 

1.13 什么 是 星 形 网 络 ? 它 的 主要 优点 是 什么 ? 

1.14 在 一 个 上 立方体 中 ， 存 有 一 个 有 7 = 2 个 元 素 的 数组 ， 其 中 的 第 ;个 元 素 位 于 处 理 器 
P; 中 。 请 设计 一 个 算法 确定 比特 定数 X 小 的 数组 元 素 的 个 数 ， 其 中 X 对 所 有 处 理 器 


均 已 知 。 
1.15 针对 线性 处 理 器 阵列 求解 问题 1.13。 
1.16 针对 环 状 网 求解 问题 1.14。 


1.17 针对 弦 环 网 络 求解 问题 1.14。 
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第 2 章 并 行 计算 数据 结构 


算法 其 实 就 是 在 适当 的 数据 结构 上 对 数据 进行 操作 的 过 程 。 数 据 结 构 是 并 行 算法 设计 和 分 
析 中 很 重要 的 部 分 。 对 特定 数据 结构 属性 的 深入 了 解 可 以 为 几 大 类 重要 的 问题 设计 出 非常 高 效 
的 算法 。 基 于 数据 结构 的 重要 性 ， 我 们 用 一 整 章 介绍 并 行 算法 设计 和 分 析 中 的 各 种 数据 结构 。 
考虑 完整 性 ， 对 所 有 的 数据 结构 都 进行 了 讨论 。 已 经 很 熟悉 数据 结构 的 读者 可 以 跳 过 本 章 。 


2.1 数组 和 列表 


数组 通常 代表 同类 数据 项 的 集合 。 数 组 也 是 列表 。 例 如 ， 十 个 学 生 的 分 数 用 数组 形式 可 
以 表示 如 下 : 





学 牛 1 2 3 4 5 6 7 8 9 10 


分 数 85 90 60 52 71 80 65 53 42 96 





在 算法 的 设计 和 分 析 中 ， 我 们 经 常用 到 下 面 的 两 个 特殊 数组 类 型 : 
a) 堆栈 ; 
b) 队列 。 
堆栈 是 一 维 数组 ， 其 元 素 的 增加 和 删除 都 在 一 端 完 
成 。 假 定 一 个 堆栈 包含 5 个 元 素 。 指 定 的 变量 top = 5 表 
明 在 堆栈 中 有 5 个 元 素 ， 第 5 个 是 最 高 项 。 如 果 新 元 素 要 
加 入 ， 它 可 以 作为 第 六 项 ，top 就 变 成 6。 
如 果 想 从 有 5 个 元 素 的 堆栈 ( 见 图 2-1) 删除 1 个 元 素 ， 
只 能 把 最 高 的 元 素 去 掉 。 向 堆栈 加 入 1 个 元 素 的 简单 过 图 2-1 有 5 个 元 素 的 堆栈 
程 如 下 所 示 : 
过 程 STACK-ADD(S(1:n), top,item) 
BEGIN 
IF top = n then 
call STACK-FULL 
ELSE 
top 一 top+1] 





S(top) 一 item， 
Endif 
END 
上 述 过 程 中 假定 堆栈 的 最 大 容量 为 -。 如 果 堆 栈 已 满 ， 就 不 能 再 插入 任何 新 元 素 。 因 此 ， 
如 果 top = n， 我 们 调用 过 程 STACK-FULL， 假 定 它 会 进行 进一步 的 处 理 。 与 此 相似 ， 可 以 写 
一 个 进行 元 素 删除 的 过 程 。 如 果 top = 0， 我 们 假定 堆栈 已 经 空 了 。 在 这 种 情况 下 不 能 从 堆栈 
中 删除 任何 元 素 。 
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过 程 STACK-DEL(S(1:n), top,item) 
BEGIN 
IF top = 0 then 
call STACK-EMPTY 
else 
item S(top) 
top “~ top—1 
Endif 
END 
堆栈 在 串 行 和 并 行 算法 中 均 有 大 量 的 应 用 。 算 术 表 达 式 的 前 级 、 后 组 和 中 缀 、 递 归 过 程 ， 
调度 和 多 项 式 估 值 等 都 是 堆栈 的 重要 应 用 领域 。 
队列 ( 见 图 2-2) 是 一 个 数组 ， 元 素 的 增加 在 其 称 作 尾 端 (rear) 的 一 端 发 生 ， 元 素 的 删 
除 在 其 称 作 前 端 〈front) 的 另 一 端 发 生 。 为 了 更 方便 地 用 队列 进行 算法 设计 ， 通 常 把 它 表 示 
成 循环 数组 的 形式 。 当 且 仅 当 rear = front 时 ， 我 们 假定 队列 是 空 的 。 为 队列 设计 播 入 和 删除 元 
素 的 过 程 很 容易 ， 我 们 把 它 留 给 读者 作为 练习 。 


后 | rear 
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图 2-2 队列 


2.2 ”链接 列表 


称 作 列 表 的 抽象 数据 类 型 是 一 个 数据 项 序列 的 集合 ， 这 些 数据 项 称 作 原 子 (atom) 和 针 
对 这 些 数据 的 操作 。 如 果 a, a;,…, a, 是 列表 中 的 原子 ， 我 们 把 列表 写成 (a, a,…, a,) 的 形式 。 
列表 和 集合 的 区 别 在 于 : 

1. 在 元 素 之 间 有 顺序 ; 

2. 如 果 应 用 程序 需要 ， 一 个 元 素 可 以 出 现 多 次 。 

在 列表 上 通常 可 以 进行 的 操作 有 : 

1. FIND(item) 一 一 检查 元 素 是 否 在 列表 中 ， 并 给 出 其 位 置 ; 

2.INSERT(item) 一 一 在 列表 中 插入 元 素 (通常 在 特定 位 置 ) ; 

3. DELETE(item) 一 一 删除 元 素 的 首次 〈 或 者 所 有 ) 出 现 。 

操作 定义 的 灵活 性 可 以 适应 多 种 应 用 。 如 果 存 在 比较 元 素 a, 和 a 的 方法 ， 即 4; <a)，ai>a;， 
或 者 a,=a,;， 我 们 可 以 定义 有 序列 表 。 升 序列 表 是 对 所 有 的 i，a,< a 的 列表 。 

如 果 通 过 维护 数组 中 的 列表 元 素来 实现 一 个 列表 ， 此 列表 为 线性 列表 。 典 型 的 线性 列表 
的 表示 形式 为 数组 4(0:N)， 其 中 4(0) 存 有 列表 元 素 的 个 数 。 这 种 表示 方法 局 限 了 数组 元 素 个 数 
为 N， 很 明显 地 会 浪费 4(4(0)+D,…, A(N)。 维 护 多 个 线性 列表 的 集合 是 很 困难 的 。 比 如 ， 要 维 
护 列 表 (4, B, C, D)，(M, N, 0) 和 (W, X,Y, Z)， 每 个 列表 允许 保留 十 个 元 素 。 可 以 把 这 些 
列表 看 做 二 维 数组 A(0:3,0:10)。 
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表 2-1 描 述 了 上 述 列 表 的 数据 结构 。 现 在 考虑 如 何 用 如 下 的 一 个 指向 数组 的 指针 数组 来 维 
护 这 三 个 列表 。 





表 2-1 二 维 数组 的 链接 列表 


位 置 数 据 链接 


1 A 5 
2 XxX 11 
3 M 8 
4 W 2 
5 B 9 
6 O 0 
了 D 0 
8 N 6 
9 C 7 

10 乙 0 
11 Y 10 
名 称 指 针 
One 1 
Two 3 
Three 4 


指针 数组 称 作 索 引 。 这 样 就 有 消除 列表 长 度 上 限 的 优势 。 惟 一 的 要 求 是 列表 不 能 在 总 长 

度 上 超过 数组 的 大 小 。 每 个 列表 只 占用 它 需要 的 空间 ， 新 列表 可 以 很 方便 地 在 末端 加 入 ( 见 

图 2-3)。 现 在 的 问题 是 如 何在 列表 中 插入 元 素 。 把 E 插 入 列表 1 得 到 (4, B, C, D,E) 的 惟一 方 
法 就 是 把 其 他 数据 都 向 右 移动 ， 如 图 2-4 所 示 。 值 得 注意 的 是 其 至 索引 都 必须 改变 。 
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图 2-3 连续 列表 
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图 2-4 在 第 一 个 列表 插入 E 后 的 列表 


另外 一 个 问题 是 列表 的 删除 。 在 很 大 的 数组 中 追踪 自由 空间 的 轨迹 是 很 困难 的 。 因 此 利 
用 线性 列表 找 不 到 维护 多 个 列表 的 有 效 实现 方法 。 

链接 列表 的 例子 ”可 以 替代 线性 列表 且 有 更 大 灵活 性 的 另 一 个 数据 结构 是 链接 列表 。 其 元 
素 称 做 节点 (node)。 一 个 节点 包含 数据 和 与 列表 中 另外 一 个 节点 的 链接 。 列 表 的 起 始 由 指针 
指示 。 如 果 有 一 个 变量 存 有 指向 列表 起 始 的 指针 ， 它 称 为 列表 的 名 称 。 前 面 例子 的 链接 列表 
结构 如 表 2-1 所 示 。 

指针 值 0 代表 任何 不 能 作为 链接 的 值 。 如 果 提 取 第 一 、 第 二 和 第 三 个 列表 ， 我 们 可 以 在 图 
2-5 中 男 出 此 结构 。 这 一 列表 结构 的 名 称 为 ONE。 


2 | 
tid 
EE i 


图 2-5 三 个 链接 列表 
特别 地 ， 这 些 列表 可 以 是 任意 长 度 。 我 们 可 以 在 一 个 存储 区 域 中 同时 维护 儿 个 列表 。 惟 
一 的 空间 限制 是 它们 总 的 存储 空间 大 小 不 能 超过 可 用 的 存储 空间 。 
链接 列表 在 搜索 上 有 一 个 很 明显 的 弱点 。 如 果 线 性 列表 是 经 过 排序 的 ， 那 么 就 可 以 用 对 
分 搜索 。 考 虑 图 2-6a 中 的 线性 列表 7， 其 链接 列表 的 等 价 表示 如 图 2-6b 所 示 。 
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图 2-6 
a) 列表 b) 链接 列表 
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对 分 搜索 函数 可 以 通过 求 列表 的 中 点 而 得 到 。 下 面 的 讨论 描述 了 对 分 搜索 的 过 程 。 上 述 
线性 列表 中 数组 元 素 1 和 5 之 间 的 中 点 是 3。 但 是 在 链接 列表 中 却 无 法 找到 两 个 节点 之 间 的 中 间 
节点 ， 所 以 也 不 可 能 进行 对 分 搜索 。 

循环 列表 在 特 环 列表 中 ， 最 后 节点 的 指针 单元 不 是 空 的 ， 而 是 指向 第 一 个 节点 。 这 在 图 
2-7a 中 给 出 。 

双向 链表 链接 列表 或 循环 列表 最 基本 的 困难 是 只 能 在 一 个 方向 移动 。 为 了 能 双向 移动 ， 
我 们 介绍 双向 链表 的 概念 。 双 向 链表 的 节点 有 两 个 链接 ， 左 链接 LLINK 和 右 链接 RLINK。 每 
个 列表 有 指向 左 端 和 右 端 的 指针 。 典 型 的 双向 链表 的 结构 如 图 2-7b 所 示 。 





a) 


| te 
b) 


图 2-7 
a) 循环 链接 列表 b) 双向 链表 


值得 注意 的 是 ， 随 着 LLINK 走 ， 会 有 一 个 链接 列表 ; 随 着 RLINK 走 ， 会 有 另 一 个 列表 。 
在 链接 列表 中 删除 一 个 节点 特别 容易 。 链 接 可 以 帮助 你 找到 不 同 的 节点 。 假 定 节点 X 有 左右 两 
个 相 邻 节点 。 它 可 以 通过 下 面 两 条 指令 删除 : 

RLINK(LLINK(X))=RLINK(X) 

LLINK(RLINK(X))=LLINK(X) 

这 使 得 最 后 生成 的 双向 链表 是 成 功 跳 过 X 的 列表 。 在 双向 链表 中 的 两 个 链表 各 自 都 可 以 

为 了 插入 一 个 包含 所 需 数据 的 节点 ， 我 们 首先 必须 得 到 一 个 未 使 用 的 节点 。 为 此 ， 我 们 
维护 一 个 特别 的 链接 列表 叫 作 自由 表 ， 用 来 保存 当前 不 用 的 节点 。 当 第 一 次 为 节点 分 配 内 存 
时 ， 便 初始 化 此 列表 。 


2.3 图 与 树 


本 节 介 绍 一 类 重要 的 数据 结构 
一 些 性 质 。 


2.3.1 预备 知识 


假设 V 是 任意 集合 ，E 是 VxV 的 子 集 ， 我 们 称 (V, E) 是 一 个 图 ， 并 记 为 G = (V, E)。 其 中 V 
称 为 图 G 的 项 点 集 且 V 中 的 元 素 称 为 图 G 的 项 点 ，E 称 为 图 G 的 边 集 且 E 中 的 元 素 称 为 图 G 的 边 。 
设 V= {abcde 刘 ，E = {(ayb),(b,c),(cyD) (ce),(a,q),(b,d)}， 图 G = (V, EE) 可 以 用 图 2-8 表 示 。 


图 模型 ， 并 给 出 以 后 几 章 将 用 到 的 各 种 类 型 的 图 以 及 
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车 e = (Vi, V2) 是 一 条 边 ， 我 们 称 e 与 vi, Vv; 关联 ， 且 vi, Vv; 是 相 邻 的 顶点 。 边 《v, 7) 称 为 环 (self 
edge)。 边 e = (ww v2) 与 e: = (vi, v2) 称 为 平行 边 (parallel edge )。 不 含 环 及 平行 边 的 图 称 为 简单 
图 (simple graph )。 顶 点 集 是 无 穷 集 的 图 称 为 无 限 图 ， 否 则 称 为 有 限 图 。 若 一 个 图 的 边 集 为 
空 集 ， 则 称 其 为 零 图 (null graph)。 没 有 边 与 之 相关 联 的 顶点 称 为 取 立 点 。 与 顶点 * 相 关联 的 
边 的 数目 称 为 "的 度 (degree)。 图 2-8 中 证 一 个 扳 立 点 ， 且 图 中 各 顶点 的 度 分 别 为 : 





a d of 
图 2-8 一 个 图 例 


度 为 1 的 顶点 称 为 悬挂 点 (pendant vertex)， 图 2-8 中 e 为 悬挂 点 。 通 常用 n 和 mm 分 别 表示 顶 
点 的 数目 和 边 的 数目 ， 我 们 感 兴趣 的 是 所 有 顶点 的 度 的 总 和 。 由 于 每 条 边 与 两 个 顶点 相关 联 ， 
因此 我 们 有 如 下 结论 : 

1. 图 的 所 有 顶点 的 度 的 总 和 为 2m; 

2. 图 中 度 为 奇数 的 顶点 的 个 数 通常 为 偶数 。 

正则 图 与 完全 图 ” 若 图 中 各 顶点 的 度 相同 ， 则 称 其 为 正则 图 。 一 个 含 n 个 顶点 的 简单 图 ， 
其 最 多 可 能 含有 n(n-1)/2 条 边 。 一 个 图 车 含有 所 有 可 能 的 边 ， 则 称 其 为 完全 图 。 一 个 含有 nn 个 
顶点 (n(n-1)/2 条 边 ) 的 完全 图 记 为 K,，K, 是 度 为 n-1 的 正则 图 。 见 图 2-9 和 图 2-10。 


图 2-9 度 为 2 的 正则 图 


通道 ， 路 ， 假设 G = (V, 妃 是 一 个 简单 图 ， Vi Va, V3, V4"', 是 图 G 的 顶点 ， 且 与 ws 
(1L<rs 人 旭 相 邻 。 车 在 序列 中 所 有 边 仅 出 现 一 次 则 称 序列 v， V2, V3 Va , Ve 为 通道 (walk )。 7 称 
为 起 点 » Vk 称 为 终点 。 在 通道 的 定义 中 可 能 存在 下 列 情况 : 虽然 i J， 但 是 = Vo 如 果 v， = Vi, 
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称 为 闭 通 道 ， 否 则 称 为 开通 道 。 在 开通 道中 ， 若 所 有 顶点 仅 出 现 一 次 ， 则 称 为 路 《path)。 在 
闭 通 道中 ， 若 所 有 顶点 仅 出 现 一 次 ， 则 称 为 图 (cycle or circuit) ， 也 就 是 说 圈 是 一 条 闭路 。 


人 Kk 


图 2-10 一 些 完全 图 
在 图 2-11 中 ，a,b,c,d,b,ef 是 一 条 通道 ， 但 它 不 是 一 条 路 ， 因 为 5 点 重复 出 现 。a,b,c,d 是 一 
条 由 a 到 4 的 路 ; c,b,e,p,h,e,b,d 既 不 是 一 条 路 ， 也 不 是 一 条 通道 ; 边 (5,e) 重 复出 现 两 次 ， 因 此 
不 是 通道 。a,b,e,f,gva 是 一 个 圈 。 在 图 中 连接 两 个 不 相 邻 顶点 的 边 称 为 弦 (chord)。 图 2-11 中 ， 
(b, 记 是 圈 a,b,e,f,g8,4 的 一 条 弦 。 





图 2-11 路 和 通道 的 说 明 图 


子 图 假设 G = (V, E) 是 一 个 图 ，V' 是 V 的 子 集 ，E' 是 E 的 子 集 且 满足 E' 中 所 有 的 边 只 与 V' 中 
的 顶点 相关 联 ， 则 称 图 G' = (V', E) 为 G 的 子 图 。 图 2-12 中 b 是 a 的 子 图 。 若 图 G 的 任何 两 个 顶点 
zw 和 v 之 间 都 有 路 存在 ， 则 称 图 G 为 连通 图 。 对 于 一 个 非 连通 图 ， 其 最 大 的 连通 子 图 称 为 连通 支 
(connected component)。 若 V' 是 V 的 子 集 ，E' 是 具有 V' 中 两 端 顶点 的 图 G 的 所 有 边 的 集合 ， 则 
称 G' = (V', E) 是 由 V' 导 出 的 图 G 的 诸 导 子 图 。 图 2-12 中 b 不 是 a 的 诱导 子 图 ; c 和 d 分 别 是 由 
{1,54} 和 {2,3,4} 导 出 的 的 诱导 子 图 。 两 个 子 图 如 果 没 有 公共 边 ， 则 称 为 边 不 相交 。 图 2-12 中 
c 和 d 是 a 的 边 不 相交 子 图 。 通 常 有 如 下 结论 : 

1. 图 G 是 它 自身 的 子 图 ; 

2. 图 中 任 一 顶点 都 可 以 看 作 具 有 此 顶点 的 图 的 诱导 子 图 ， 

3. 图 中 任 一 条 边 (z 由 都 可 以 看 作 由 {u 只 导出 的 诱导 子 图 ; 
4. “ 子 图 ”关系 是 自 反 的 、 反 对 称 的 、 传 递 的 。 
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1 2 
3 
5 4 
a) 
2 
1 
3 
4 
b) 
1 2 
人 | | 
5 4 
c) 4 d) 
图 2-12 


a) 图 G b) G 的 子 图 c) 由 {1,4,5} 导 出 的 子 图 d) 由 {2,3,4} 导 出 的 子 图 


和 同 胚 ”G 是 一 个 图 ，v, yz, v; 是 一 条 路 ， 且 v; 的 度 是 2。(v, vv) 和 (ww，v) 称 为 相继 边 〈series 
edge)。 若 用 一 条 边 (v', v;) 代 赫 两 条 边 (v,, v,} 和 (v,, v3) 并 且 去 掉 顶 点 v,， 则 称 为 相继 边 融 合 
(merging of series edges)。 若 (u,v) 是 一 条 边 ， 增 加 一 个 新 的 顶点 w 并 且 使 之 分 别 与 4,v 都 相 邻 ， 
同时 去 掉 原始 的 边 (4, v)， 则 称 为 度 为 2 的 顶点 的 插入 。 两 个 图 G, 和 G,， 如 果 其 中 的 一 个 图 可 以 
由 另 一 个 图 经 过 有 限 个 相继 边 的 融合 和 (或 ) 度 为 2 的 顶点 的 插入 得 到 ， 则 称 它们 是 同 胚 的 。 

”一 个 完全 子 图 称 为 团 (clique )。 一 个 团 如 果 不 是 任何 其 他 团 的 子 图 则 称 为 极 大 团 
(maximal clique )。 对 于 图 2-13a， 图 2-13b 是 其 相应 的 极 大 团 。 

同 构 ”对 于 图 G = (V, 8) 和 G' = (V', E)， 如 果 在 V 与 V' 间 存在 一 个 一 一 上 映射， 使 得 V 中 的 两 
个 顶点 相 邻 的 充 要 条 件 是 相应 的 V' 中 的 顶点 也 相 邻 、 则 称 两 个 图 是 同 构 的 。 如 果 两 个 图 是 同 
构 的 ， 则 有 如 下 性 质 : 

1. 有 相同 数目 的 顶点 ; 

2. 有 相同 数目 的 边 ; 

3. 对 于 给 定 的 度 ， 有 相同 数目 的 顶点 。 

上 面 的 三 个 条 件 是 必要 但 不 充分 的 。 寻 找 简单 又 有 效 的 标准 去 考察 两 个 图 是 否 同 构 是 一 
个 有 趣 的 研究 课题 。 这 个 问题 称 为 同 构 问 题 。 
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图 2-13 
a) 图 G ”b) G 的 极 大 团 


2.3.2 欧 拉 图 与 哈密 顿 图 


本 节 介 绍 两 个 特殊 类 型 的 图 一 一 欧 拉 图 和 哈密 尔 顿 图 ， 它 们 在 各 个 领域 都 有 广泛 应 用 。 
欧 拉 图 是 由 欧 拉 给 出 的 ， 这 一 图 模型 来 源 于 著名 的 哥 尼斯 堡 七 桥 问 题 。 

对 于 图 G = (V, EB)， 一 条 遍历 图 的 每 条 边 恰 好 一 次 的 闭 通道 称 为 欧 拉 闭 迹 。 并 不 是 每 个 图 都 
含有 欧 拉 闭 迹 。 例 如 ， 四 个 顶点 的 完全 图 K, 不 含有 欧 拉 闭 迹 。 含 有 欧 拉 闭 迹 的 图 称 为 欧 拉 图 。 
定理 2-1 ( 欧 拉 定理 ) 当 且 仅 当 连通 图 的 每 个 顶点 的 度 是 偶数 时 ， 此 连通 图 是 欧 拉 图 。 

定理 的 证 明 并 不 难 。 由 于 通道 是 闭合 的 且 经 过 每 条 边 恰好 一 次 ， 无 论 何 时 当 这 条 通道 经 
过 一 条 边 到 达 一 个 顶点 时 ， 它 必须 要 从 这 个 顶点 离开 而 经 过 另 一 条 边 。 由 这 个 事实 我 们 可 以 
证 明 上 述 定理 。 同 样 地 ， 由 欧 拉 闭 迹 的 定义 容易 证 明 下 面 的 定理 。 

定理 2-2 。” 当 且 仅 当 图 的 边 集 E 可 以 分 解 成 E = EIUEBU…UE: 且 每 一 个 已 由 一 个 国 组 成 时 ， 
此 图 为 欧 拉 图 。 

一 个 开通 道 仅 一 次 遍历 所 有 的 边 ， 称 为 欧 拉 开 迹 。 一 个 图 若 含 有 欧 拉 开 迹 则 称 为 一 笔 图 。 
不 难 证 明 如 下 定理 。 

定理 2-3 当 且 仅 当 图 中 含有 两 个 奇数 度 的 顶点 时 ， 此 图 为 一 笔 图 。 

利用 定理 2-1 设 计 一 个 串 行 多 项 式 算法 ， 可 用 来 检验 一 个 图 是 否 为 欧 拉 图 。 也 可 以 通过 验 
证 每 个 顶点 的 度 是 否 是 偶数 来 判定 图 是 否 为 欧 拉 图 。 如 果 每 个 顶点 的 度 是 偶数 ， 我 们 可 以 判 
定 该 图 是 欧 拉 图 。 类 似 地 ， 可 以 通过 计算 奇数 度 的 顶点 的 个 数 来 判定 一 个 图 是 否 为 一 笔 图 。 

哈密 顿 图 一 条 闭合 通道 遍历 图 的 每 个 顶点 恰好 一 次 ， 则 称 该 图 为 哈密 顿 图 (Hamiltonian 
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circuit )。 这 个 定义 类 似 于 欧 拉 闭 迹 的 定义 。 欧 拉 闭 迹 是 指 遍 历 每 条 边 恰 好 一 次 ， 而 哈密 顿 圈 
是 指 遍 历 每 个 顶点 恰好 一 次 。K, 是 哈密 顿 图 但 不 是 欧 拉 图 。 如 果 两 个 圈 C,, C, 恰 有 一 个 公共 顶 
点 ， 则 Ci,UCs 是 欧 拉 闭 迹 不 是 哈 窗 顿 图 。 连 通 图 是 否 存 在 欧 拉 闭 迹 的 充 要 条 件 已 在 定理 2-1 和 
定理 2-2 给 出 。 然 而 ， 它 是 否 存在 哈密 顿 圈 的 充 要 条 件 仍然 没有 解决 。 尽 管 这 个 问题 早 在 1859 
年 就 由 爱尔兰 数学 家 William Rowan Hamilton 提 出 ， 但 至 今 仍 有 待 解决 。 


2.3.3 树 
不 含 圈 的 连通 图 称 为 树 。 下 面 的 叙述 是 等 价 的 。 
1. G 是 一 个 树 ; 


2. G 中 的 任何 两 点 间 恰 有 一 条 路 ; 

3. G 是 连通 的 且 含 有 "个 顶点 和 "1 条 边 ; 

4. G 是 极 小 连通 图 ; 

5. G 不 含 圈 且 有 n 个 顶点 和 n-1 条 边 。 

任何 一 个 树 至 少 有 两 个 基 挂 点 。 路 的 长 度 等 于 其 边 的 数目 。 从 顶点 v 到 其 他 顶点 的 最 长 的 
路 的 长 度 称 为 v 的 离心 率 或 直径 ， 并 记 为 E(Y)。 

E(v) = Max{d(v, WwW/u EV} 

这 里 d(u, v) 表 示 从 vy 到 4 的 路 的 长 度 。 在 树 T 中 ， 具 有 最 小 离心 率 的 顶点 称 为 从 v 到 u 树 的 中 
心 。 一 个 树 含有 一 个 或 两 个 中 心 。 图 2-14a 中 给 出 了 所 有 顶点 的 离心 率 。3 和 5 有 最 小 的 离心 率 ， 
因此 图 中 有 两 个 中 心 3 和 5。 中 心 的 离心 率 称 为 树 的 半径 。 树 中 最 长 路 的 长 度 称 为 树 的 直径 。 
对 于 图 2-14a 中 给 定 的 树 ， 其 半径 是 3， 直 径 是 Ss。 我 们 可 以 指定 一 个 顶点 作为 树 的 根 。 如 果 一 
个 顶点 被 指定 为 树 的 根 ， 则 称 这 个 树 为 有 根 树 。 


顶点 123456789 10 





图 2-14 
a) 半径 =3 和 直径 =5 的 树 b) 有 根 树 
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考虑 图 2-14a 中 所 给 的 树 。 如 果 指 定 2 作为 树 根 ， 就 可 重新 描绘 该 树 如 图 2-14b。 作 为 有 根 
树 ， 每 个 顶点 的 层 数 这 样 定义 : 树 根 被 指定 为 第 0 层 ， 与 根 相 邻 的 顶点 称 为 根 的 孩子 ， 它 们 被 
指定 为 第 1 层 。 树 根 又 称 为 孩子 的 双亲 。 

在 图 2-14b 描 述 的 有 根 树 中 ，1 和 3 是 2 的 孩子 。 如 果 顶 点 v 位 于 i 层 ， 任 何不 是 v 的 双亲 且 与 
它 相 邻 的 顶点 u 被 指定 在 i+1 层 ， 这 样 的 顶点 称 为 v 的 孩子 。 如 果 有 根 树 的 最 大 层 数 是 tx， 那 么 
它 的 高 度 (或 深度 ) 为 k+1。 

图 2-14b 中 树 的 高 度 为 5。 树 的 连通 子 图 称 为 子 树 。 图 2-15 展 示 了 树 及 其 子 树 。 有 根 树 通 常 
用 双亲 关系 来 描述 。 假 设 7 = (V, ) 是 一 个 有 根 树 ， 其 根 为 "， 我 们 可 用 数组 PARENT(1:n) 来 表 
示 (nn 是 顶点 数目 ): 

如 果 ; 不 是 树 根 ， 那 么 PARENT(D = i 的 双亲 ; 

如 果 r 是 树 根 ， 那 么 PARENT(7) = r。 


3 子 树 T， 
4 2 
4 
子 树 T。 
10 5 





图 2-15 树 和 它 的 一 些 子 树 
有 些 情 况 下 定义 PARENT 为 -1。 图 2-16 展 示 了 树 及 其 PARENT 表 示 。 





3 4 5 6 7 8 9 
PARENT (站 3 3 4 4 2 4 4 7 7 


图 2-16 树 根 及 其 PARENT 表 示 
二 叉 树 有 根 树 若 其 每 一 个 顶点 至 多 有 两 个 孩子 则 称 为 二 又 硅 。 二 又 树 被 广泛 应 用 于 计算 
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机 科学 中 。 这 两 个 孩子 通常 称 作 左 孩子 和 右 孩 子 。 车 其 没有 顶点 含有 左 孩 子 ， 则 称 为 右 科 
(right skewed) 二 又 树 。 类 似 地 可 定义 左 儿 二 又 树 。 图 2-17 所 示 为 左 斜 和 右 斜 二 又 树 。 考 虑 图 
2-18 所 示 的 二 又 树 : 在 第 0 层 存在 惟一 的 树 根 ， 第 1 层 有 2 个 顶点 ， 第 2 层 有 4 个 顶点 ， 第 3 层 有 8 
个 顶点 。 通 过 观察 有 如 下 定理 : 
定理 2-4 
a) 在 一 个 二 又 树 中 ， 第 i 层 至 多 有 2 个 顶点 ; 
b) 高 度 为 k 的 树 的 顶点 最 大 数目 为 2:-1。 


5 
左 斜 一 叉 树 








证 明 : 用 归纳 法 证 明 a)。 

当 i= 0 时 ， 结 论 是 正确 的 。 

假设 第 ; 层 时 结论 正确 ， 即 第 ;有 层 至 多 有 2 个 顶点 。 由 于 第 ; 层 的 每 个 顶点 至 多 能 产生 2 个 孩 
子 。 因 此 第 i+1 层 至 多 有 2*' 个 顶点 。 由 归纳 法 可 知 a) 成 立 。 

b) 的 证 明基 于 如 下 的 数值 结果 : 

2°+2'+2 +++ 27!1 = 21 

高 度 为 k 且 有 2-1 个 顶点 的 树 称 为 满 二 又 桂 。 满 二 又 树 的 顶点 可 用 数字 按 序列 编号 ; 树 根 
为 1， 第 1 层 的 两 个 顶点 自 左 至 右 记 为 2 和 3; 当 对 第 i-1 层 的 所 有 顶点 编 完 号 后 ， 再 用 连续 数字 
对 第 i 层 的 顶点 自 左 至 右 编 号 。 图 2-18 给 出 了 一 个 3 层 的 满 二 又 树 、 并 用 连续 数字 对 各 个 顶点 编 
号 。 下 面 的 定理 对 于 满 二 又 树 很 容易 证 明 。 
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定理 2-5 对 于 用 连续 数字 编号 的 满 二 又 树 而 言 ， 

a) 第 i 个 顶点 的 左 孩 子 是 2i; 

b) 第 i 个 顶点 的 右 孩 子 是 2i+1; 

c) i 的 双亲 是 [i/2]。 

在 满 二 又 树 中 ， 如 果 去 掉 某 些 具 有 最 高 数字 编号 的 顶点 ， 则 称 为 完全 二 又 树 。 图 2-19a 所 
示 为 完全 二 又 树 ， 图 2-19b 则 是 满 二 又 树 ， 而 图 2-19c 中 是 不 完全 二 又 树 。 在 完全 二 叉 树 中 顶点 
编号 是 连续 的 ， 并 且 与 同样 高 度 的 满 二 叉 树 一 致 。 定 理 2-5 对 于 完全 二 叉 树 亦 成 立 。 考 虑 一 个 
二 叉 树 ， 每 个 感 挂 点 给 定 一 个 正 权 ， 用 /上 和 w; 分 别 表 示 层 数 和 悬挂 点 的 权 。 考 虑 21w, ， 它 取 
遍 了 所 有 的 悬挂 点 ， 这 个 和 称 为 加 权 路 径 长 度 (weighted path leng 由 )。 例 如 图 2-20 中 ，6 个 基 
挂 点 d,q,8pr 和 f， 相 应 的 权 分 别 为 95，10，7，3，4 和 8。 权 和 层 数 如 下 表 所 示 。 





©) 


图 2-19 
a) 完全 二 又 树 b) 满 二 又 树 c) 不 完全 二 又 树 
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图 2-20 加 权 路 径 长 度 =95 的 树 


悬挂 点 权 层 数 lw 
d 5 2 10 

gq 10 2 20 

g 7 3 21 

Pp 3 4 12 

r 4 4 16 

f 8 2 16 
Elw, 95 





给 定 n 个 悬挂 点 及 相应 的 权 ， 构 造 一 个 具有 最 小 加 权 路 径 长 度 的 二 又 树 是 一 个 有 趣 的 问 
题 。 它 在 判定 树 以 及 优化 程序 结构 等 方面 有 许多 应 用 。 图 2-21 给 出 了 几 个 二 又 树 及 其 加 权 路 
径 长 度 。 


Ewh=65 5 7 





Zwil, =60 


图 2-21 二 叉 树 及 其 加 权 路 径 长 度 
支撑 树 ”G = (V, E) 是 一 个 连通 的 简单 图 ， 具 有 G 所 有 顶点 的 无 圈 的 连通 子 图 7 = (V, E') 称 
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为 G 的 支撑 树 。 图 2-22a 至 d 给 出 了 图 G 和 它 的 支撑 树 。 


2 t 
8 
5 6 
7 
3 4 
a) 
2 1 
8 
5 6 
7 
3 4 


b) 





d) 


图 2-22 
a) 图 G b) 支撑 树 T，c) 支撑 树 T，d) 支撑 树 T 


图 2-23a 中 ，ab,cde 和 /分 别 表示 6 个 城市 ， 城 市 之 间 的 距离 用 边 的 权 来 表示 。 假 设 在 城市 
中 已 经 安装 了 通讯 网 络 ， 并 且 认 为 在 图 2-23b 中 所 示 的 支撑 树 的 边 之 间 建 立 的 链接 已 经 足够 。 
在 两 个 城市 之 间 通 讯 电 缆 的 安装 费用 与 它们 之 间 的 距离 成 正比 ， 即 与 边 的 权 成 正比 ， 因 此 安装 
的 总 成 本 与 边 的 权 总 和 成 正比 。 我 们 必须 找到 一 个 支撑 树 ， 使 得 其 边 的 权 总 和 最 小 。 给 定 一 个 
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无 向 图 ， 寻 找 最 小 权 支 撑 树 是 一 个 有 趣 的 问题 。 最 小 权 支 撑 树 也 称 为 最 小 成 本 支撑 树 
(minumum cost spanning tree) 或 最 短 支撑 树 。 每 一 个 含 n 个 顶点 的 连通 图 G 都 有 一 个 含 n-1 条 
边 的 支撑 树 T， 这 n-1 条 边 称 为 树枝 。 不 在 树 中 的 边 称 为 蓄 。 如 果 图 G 是 不 连通 的 ， 它 就 有 许多 
分 支 。 在 这 种 情形 下 ， 我 们 可 以 对 每 一 个 分 支 寻找 相应 的 支撑 子 树 ， 这 些 支撑 子 树 的 集合 称 为 
G 的 支撑 森林 。 图 2-25 给 出 了 在 图 2-24 中 所 示 的 不 连通 图 的 支撑 森林 。 





图 2-23 
a) 城市 和 它们 之 间 的 距离 b) 六 个 城市 的 通讯 链 路 ， 总 成 本 为 10 + 3+5+6+4=28 


~ 
一 
心 
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a 
一 
Lo 
> 
a 
“a 
一 
一 


图 2-25 G 的 支撑 森林 
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假设 图 G 有 n 个 顶点 ，m 条 边 和 c 个 分 支 。G 的 支撑 森林 有 n-c 个 树枝 和 m~n + < 条 弦 。 我 们 
定义 图 的 秩 (rank) 为 树枝 的 个 数 ， 图 的 零 维 数 (nullity) 为 弦 的 个 数 。 在 图 2-25a 中 ,nn = 15,m = 
18,c= 3, 

秩 =n-c= 15-3=12 
零 维 数 =m-n+c=18-15+3=6 

注意 秩 与 零 维 数 之 和 等 于 边 的 数目 。 对 于 连通 图 而 言 ， 其 秩 为 -1， 零 维 数 为 m-n+1。 考 
虑 连通 图 G，7 是 支撑 树 ，e 是 粥 。 如 果 把 e 放 在 T 中 ， 则 生成 一 个 圈 ， 并 设 这 个 圈 为 

ebib,…b, 

这 里 b,, b,…b, 是 树枝 ，e 是 惟一 的 弦 。 这 个 圈 称 为 基本 图 (fundamental cycle)。 总 共有 
mn+1 个 基本 圈 。 计 算 图 的 支撑 树 的 数目 也 是 一 件 很 有 趣 的 事 。 假 设 G 是 一 个 图 ，T 是 它 的 支 
撑 树 ，e 是 一 条 纺 ，eb,b,…b, 是 基本 轿 。 如 果 将 e 加 到 T 中 同时 去 掉 T 中 的 基 条 边 b;,， 则 得 到 不 同 
的 支撑 树 ( 称 为 {T;(e)})。 对 于 每 一 条 弦 e 我 们 可 以 找 出 这 些 支 撑 树 {T.(e), i = 12…,}。 对 于 
给 定 的 支撑 树 T， 可 以 通过 重复 上 述 操作 来 得 到 一 些 支 撑 树 。 图 2-26a、b、c 给 出 了 图 G 及 其 支 


> 


a) 


人 EC 
人 ss 
[1 | > 
| > 
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c) 


图 2-26 
a) 图 G b) G 的 一 些 支撑 树 c) G 的 另 一 些 支撑 树 
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撑 树 。 在 支撑 树 中 加 弦 以 及 从 基本 圈 中 去 掉 树 枝 的 操作 称 为 图 互 换 。 给 定 图 G 的 任意 两 个 支撑 
树 T, 和 7T,， 其 中 一 个 可 由 另 一 个 经 过 有 限 次 圈 互 换 得 到 ， 并 且 圈 互 换 的 次 数 等 于 不 同时 在 两 个 
支撑 树 中 的 边 的 数目 。 

我 们 定义 : 

d(T,, 7) = 由 区 得 到 TT 所 需 的 圈 互 换 的 次 数 

= 在 了 中 而 不 在 7 中 的 边 的 数目 

由 观察 可 知 ，d(T, 7) 满 足 如 下 性 质 : 

1. d(T, 7)>0 并 且 dT ,7)=0 ( 当 且 仅 当 T=T) ; 

2. d(T,, T,) = d(T,, 7); 

3. 对 于 任 一 不 同 于 TT 或 7, 的 支撑 树 T,， 满 足 d(T, TD)<d(T ,TD)+d(T 7T,)。 

另外 ，d(T,, 7,) 不 能 超过 图 的 秩 或 零 维 数 。 假 设 G 是 连通 图 ，7T 是 G 所 有 支撑 树 的 集合 ， 用 
7 作为 顶点 集 。 可 将 图 G 表 示 成 Cr = (T, En)， 当 且 仅 当 d(T, 7) = 1 时 ，7 的 两 个 顶点 T,，7T, 之 间 
用 一 条 边 相 连 。 图 G7 称 为 图 G 的 树 图 (tree graph ) 。 


2.3.4 图 的 遍历 


很 多 关于 图 的 问题 需要 系统 地 访问 图 的 每 一 个 顶点 。 为 了 实现 对 顶点 的 遍历 ， 下 面 给 出 
两 种 方法 : 

1. 广度 优先 搜索 (BFS ) ; 

2. 深度 优先 搜索 (DFS ) 。 

为 了 遍历 图 ， 起 始点 是 已 知 的 。 假 定 v 是 起 始点 ，BFS 由 v 点 开始 。 访 问 完 v 点 后 ， 按 照 规 
定 的 顺序 访问 所 有 与 v 相 邻 的 点 v1,v;,…vs。 访 问 完 这 些 顶点 后 ， 再 访问 与 这 些 顶点 相 邻 的 未 被 
访问 的 顶点 ， 重 复 这 个 过 程 直 到 所 有 的 顶点 都 被 访问 。 在 DFS 技 术 中 ， 由 v 点 开始 访问 与 v 相 
邻 的 顶点 w， 再 访问 与 w 相 邻 而 未 被 访问 过 的 顶点 。 某 种 情况 下 ， 如 果 没 有 与 w 相 邻 且 未 被 访 
问 过 的 顶点 ， 退 到 v-, 并 且 访 问 与 w-, 相 邻 且 未 被 访问 的 顶点 ， 重 复 这 个 过 程 直 到 退回 到 "， 并 
且 访 问 所 有 与 v 相 邻 的 顶点 。 遍 历 形成 G 的 支撑 树 。 图 2-27a、b、c 分 别 表示 图 G， 图 G 的 BFS 
支撑 树 和 DFS 支 撑 树 。 
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c) 


图 2-27 ” ( 续 ) 
b) BFS 支 撑 树 c) DFS 支 撑 树 
在 BFS 支 撑 树 中 ,虚线 表示 续 ， 实 线 表 示 树 枝 , 而 且 每 一 条 弦 连 接 的 顶点 或 者 在 同一 层 上 ， 
或 者 在 连续 层 上 。 这 个 性 质 被 有 效 地 用 于 解决 图 论 中 的 一 些 问题 。 


2.3.5 连通 性 


设 G = (V,E) 是 一 个 图 ，v E V，G-* 表 示 由 VY-{y} 导 出 的 图 。 如 图 2-28a 至 c 所 示 。 设 G = 
(V,E) 是 一 个 有 Ek 个 分 支 的 图 ，a E V。 如 果 图 G-a 的 分 支 数 多 于 Kk 个， 则 称 4 为 断 点 (articulation 
point)。 在 连通 图 中 ， 如 果 去 掉 某 个 点 后 图 变 得 不 连通 了 ， 就 把 该 点 称 为 断 点 。 如 图 2-28a 所 
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示 ， 顶 点 4 和 7 是 两 个 断 点 。 不 含有 断 点 的 连通 图 称 为 2- 连 通 图 (biconnected graph )。 任 何 圈 
是 2- 连 通 的 。 设 G = (V,E) 是 一 个 图 ，u，v 是 G 的 同一 分 支 的 两 个 不 相 邻 的 顶点 ，5 是 V 的 子 集 。 
如 果 去 掉 5 后 ，u，v 位 于 不 同 的 分 支 上 ， 则 称 $ 是 u-v 分 离 集 (separator )。 换 句 话说 ， 如 果 5 是 
u-v 分 离 集 ， 那 么 不 存在 一 条 不 经 过 5S 的 顶点 从 u 到 v 的 路 。 对 于 u-v 分 离 集 ， 若 其 不 包含 其 他 的 
u-v 分 离 集 ， 则 称 为 极 小 u-v 分 离 集 。 具 有 最 少 顶点 数 的 u-v 分 离 集 称 为 最 小 u-v 分 离 集 。 

设 % = {1234} S$S,={1,2,4} 5;= {2,4} 


S = {2,4,8} S$; = {8} S$, = {5} 
1 2 2 
4 7 
3 
5 6 
a) 
1 2 8 
| 
3 人、 


6 


b) 


C) 
图 2-28 
a) 图 G b) 图 G-4 c) 图 G-1 


5S;,52,5554,5; 和 Ss 每 个 都 是 图 G (如 图 2-29) 的 7-6 分 离 集 。5; 是 一 个 极 小 7-6 分 离 集 ， 同 样 ， 
5; 和 和 56 也 是 极 小 分 离 集 。5; = {8} 和 56 = {5} 是 图 G 的 两 个 最 小 7-6 分 离 集 。 
设 G = (V,E) 是 一 个 连通 图 ，5 是 V 的 子 集 。 如 果 G-5 是 不 连通 的 ， 则 称 S 是 G 的 分 离 集 。 如 
果 对 于 任意 5 的 子 集 5'，5' 不 是 分 离 集 ， 则 称 5 是 极 小 分 离 集 。 具 有 最 少 顶 点 数 的 极 小 分 离 集 称 
为 最 小 分 离 集 。 最 小 分 离 集中 顶点 的 个 数 称 为 图 的 顶点 连通 度 。 换 句 话说 ,连通 图 的 顶点 连 
通 度 等 于 使 得 余下 的 图 成 为 不 连 图 所 需要 去 掉 的 最 少 顶点 数 为 不 连通 图 。 注 意 ， 如 果 图 含有 
断 点 ， 则 顶点 连通 度 是 1。 顶 点 连通 度 为 1 的 图 称 为 可 分 离 图 (separable graph)。 不 可 分 离 图 
也 叫做 2- 连 通 图 。2- 连 通 图 的 顶点 连通 度 至 少 是 2。 顶 点 连通 度 至 少 是 3 的 连通 图 称 为 3- 连 通 图 
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(triconnected graph ) 。 换 句 话说， 对 于 3- 连 通 图 ， 去 掉 任 何 一 个 或 两 个 顶点 都 不 能 使 它 变 得 不 
连通 。 由 观察 可 知 ， 任 一 3- 连 通 图 都 是 2- 连 通 的 ， 任 一 2- 连 通 图 都 是 连通 的 。 顶 点 连通 度 至 少 
为 的 连通 图 称 为 -连通 图 (Kk 是 正 整 数 )。 很 容易 得 到 下 面 的 结论 : 

1. 当 且 仅 当 对 于 任意 两 个 顶点 4，v， 由 Uu 到 Vv 至少 存在 两 条 内 部 点 不 相交 的 路 时 ， 连 通 图 


是 2- 连 通 的 。 

2. 当 且 仅 当 对 于 任意 两 个 顶点 4，v， 由 UU 到 Vv 至 少 存 在 三 条 内 部 点 不 相交 的 路 时 ， 连 通 图 
是 3- 连 通 的 。 | 

3. 当 且 仅 当 对 于 任意 两 个 顶点 4，vV， 由 Uu 到 Vv 至 少 存 在 k 条 内 部 点 不 相交 的 路 时 ， 连 通 图 是 
kk- 连通 的 。 





7 10 
图 2-29 图 G 
图 2-28a 和 图 2-29 中 所 示 的 图 是 连通 的 ， 但 不 是 2- 连 通 的 。 任 一 个 圈 C, 是 2- 连 通 的 。 图 
2-30 所 示 是 一 个 3- 连 通 图 。 如 果 d 表 示 图 G 中 顶点 的 最 小 度 ， 则 G 的 顶点 连通 度 至 多 是 4。 
7 6 
5 


和 到 


[一 


图 2-30 3- 连 通 图 
不 连通 图 有 不 止 一 个 连通 支 。( 一 个 连通 支 就 是 一 个 极 大 连通 子 图。) 同样 地 ， 我 们 定义 
2- 连 通 支 是 图 的 极 大 2- 连 通 子 图 。 如 果 图 本 身 是 2- 连 通 的 ， 则 只 有 一 个 2- 连 通 支 。 图 2-31b 给 
出 了 图 2-31a 的 2- 连 通 支 。2- 连 通 支 也 称 为 块 (block)。 如 果 图 G 中 每 一 个 块 都 是 完全 子 图 ， 则 
称 该 图 为 块 图 (block graph)。 图 2-32a 所 示 为 块 图 。 由 下 列 算 法 可 找 出 图 G 的 2- 连 通 支 : 
1. 如 果 图 G 没 有 断 点 ， 则 它 自 身 是 惟一 的 2- 连 通 支 ; 
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2. 对 于 每 一 个 断 点 a E V， 令 TV,V 网 分 别 表 示 G-{tal} 不 同 分 支 的 顶点 集 ，G; 表示 由 
顶点 VUf{Q} 导 出 的 图 (i = 1.2.3……,9)。 





3 
2 3 3 7 10 
VL D7 
8 
4 5 6 11 
b) 
图 2-31 
a) 图 G 是 连通 图 但 不 是 2- 连 通 图 b) 图 G 的 2- 连 通 支 


12 13 





a) 





2-32 
a) 块 图 b) 图 2-32a) 中 块 图 的 BC 树 
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所 有 的 定义 和 过 程 都 可 以 推广 到 -连通 支 (k>2)。 块 图 可 以 用 它 的 Block-Cut 顶 点 树 表 示 
(BC 树 )。 例 如 ， 考 虑 图 2-32a 中 所 示 的 块 图 ， 它 的 块 为 ， 

Bi = {1,2}, B, = {2,3,4,5}, B, = {5,6,7}, B, = {5,9}, B, = {5,8} 

B= {8,10}, B, = {10,11}, Bs = {10,12,13}, B, = {4,14}, 

割 点 是 2，4，5，8，10。BC- 树 的 顶点 集 由 块 和 割 点 组 成 ， 仅 当 割 点 包含 在 某 个 块 中 时 ， 
块 和 制 点 用 一 条 边 相 连 。 图 2-32b 给 出 了 图 2-32a 所 示 的 块 图 的 BC 树 。 


2.3.6 可 平面 图 


任何 图 都 可 以 用 多 种 方法 来 图 示 ， 图 2-33 给 出 了 图 G = (V,E) 的 几 种 图 示 ， 其 中 
V= {a,b,cd,e fe h} 
已 = {(a,b),(b,c) ,cd),(d,a) (ef ),f,8),(8h) ,bye) ae) (bf ) ce) ,dh)} 





图 2-33 同一 个 图 的 不 同 的 图 示 


我 们 感 兴趣 的 是 在 二 维 平面 上 描绘 一 个 图 ， 使 得 任何 两 条 边 彼 此 不 相交 。 很 显然 ， 并 不 是 
所 有 的 图 都 能 如 此 。 如 果 一 个 图 可 以 在 二 维 平面 上 描绘 ， 并 使 得 任何 两 条 边 彼此 不 相交 ， 则 称 
此 图 为 可 平面 图 。 图 2-34 给 出 了 可 平面 图 的 几 个 简单 例子 。 如 果 将 图 G = (V,E) 的 顶点 集 V 分 成 两 
部 分 Vi 和 V,， 使 得 图 G 的 每 一 条 边 都 连接 V 的 一 个 顶点 和 VY 的 一 个 顶点 ， 则 称 图 G 为 二 部 图 。 注 意 
二 部 图 不 含有 奇数 长 度 的 圈 。 如 果 V 的 每 一 个 顶点 都 与 VW 的 所 有 顶点 相 邻 ， 则 此 二 部 图 称 为 完全 
二 部 图 。 完 全 二 部 图 中 如 果 V. 有 mm 个 顶点 ，V 有 nn 个 顶点 ， 则 记 为 K,。 注 意 ，K 含有 m+n 个 顶点 
和 mn 条 边 。 波 兰 数学 家 库 拉 托 斯 基 (Kuratowski) 证 明了 如 下 两 个 图 (图 2-35) 是 不 可 平面 图 。 

1. 含有 5 个 顶点 的 完全 图 (K;) ; 

2. 完全 二 部 图 K,,。 
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K， 
5 
4 
人 1 2 
K。 
1 3 
6 
图 2-34 一 些 可 平面 图 
3 
4 1 a 
2 
2 b 
5 
1 3 C 


Ks Ks 
图 2-35 库 拉 托 斯 基 图 


观察 可 知 ， 库 拉 托 斯 基 图 是 正则 图 ， 而 且 是 不 可 平面 图 。 我 们 还 注意 到 ， 考 虑 顶点 数 和 
边 数 ， 库 拉 托 斯 基 图 是 极 小 不 可 平面 图 。 

考虑 可 平面 图 G， 将 其 画 在 一 个 平面 上 ( 边 不 相交 )。 图 G 将 平面 分 成 若干 个 区 域 。 如 图 
2-36 所 示 。Ri,R,,…,R 表 示 可 平面 图 G 在 平面 上 所 划分 的 区 域 。 

很 容易 得 到 下 面 结论 : 

1. 任何 一 个 简单 可 平面 图 都 可 以 谋 入 平面 ， 且 图 的 每 一 条 边 可 用 一 条 直线 段 来 描绘 ; 

2. 任何 一 个 简单 可 平面 图 都 可 以 嵌入 平面 ， 且 任 冲 指定 的 区 域 可 以 是 无 穷 区 域 ; 

3. 任何 一 个 简单 可 平面 图 都 可 以 嵌入 球面 ; 可 以 眶 入 球面 的 图 是 可 平面 图 。 

含有 n 个 顶点 和 m 条 边 的 连通 可 平面 图 G 能 产生 m-n+2 个 区 域 。 如 图 2-36, n=13, m= 17， 
产生 的 区 域 数 是 m~n+2 = 17-13+2 = 6。 


1 3 





图 2-36 有 6 个 区 域 的 可 平面 图 
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同时 还 可 证 明 ， 含有 n 个 顶点 和 m 条 边 的 连通 可 平面 图 满足 : m< 3n-6。 这 是 一 个 必要 条 
件 而 不 是 充分 条 件 。 库 拉 托 斯 基 的 第 二 个 图 就 满足 这 个 条 件 ， 但 它 不 是 可 平面 图 。 图 G 是 可 平 
面 图 的 充分 必要 条 件 是 图 C 中 不 含有 库 拉 托 斯 基 的 两 个 图 或 不 含有 与 库 拉 托 斯 基 的 两 个 图 同 胚 
的 图 。 将 可 平面 图 做 入 到 平面 ， 如 果 图 的 所 有 顶点 都 在 外 部 区 域 上 ， 则 称 此 平面 图 为 外 可 平 
面 图 。 在 外 可 平面 图 中 ， 如 果 在 任何 两 个 不 相 邻 的 顶点 之 间 增 加 一 条 边 而 使 之 不 再 是 外 平面 
图 ， 则 此 外 可 平面 图 是 极 大 外 可 平面 图 (mop)。 哈 密 顿 图 就 是 mop 图 。 


2.3.7 ”染色 与 独立 集 


染色 是 指 将 图 的 每 个 顶点 染 上 颜色 。 许 多 研究 人 员 已 经 研究 了 对 图 的 边 进行 染色 的 问题 ， 
称 为 边 染色 (edge coloring )。 对 顶点 进行 染色 称 为 顶点 染色 (vertex coloring )。 在 这 里 我 们 
只 考虑 顶点 染色 ， 因 此 提 到 染色 就 是 指 顶 点 染色 。 如 果 任 何 两 个 相 邻 的 顶点 染 不 同 的 颜色 ， 
则 称 此 染色 为 正常 染色 (perfect coloring )。 

图 2-37 所 示 为 图 C 和 它 的 三 种 不 同 的 正常 染色 。 我 们 主要 感 兴趣 的 是 用 最 小 数目 的 颜色 给 
一 个 图 染色 。 这 样 的 染色 称 为 正常 最 小 染色 (perfect minimum coloring )， 最 小 染色 的 颜色 数 
称 为 色 数 (chromatic number )。 





W = 白色 

B = 蓝 色 

R= 红色 

Y= 黄色 

BK = 黑色 

BN = 棕色 

V = 紫色 
P = 粉红 色 

图 2-37 图 的 三 种 正常 染色 
下 表 中 列 出 了 一 些 常见 图 的 色 数 : 

序号 图 色 数 
1 Kk, n 
2 树 2 
3 无 边 图 1 
4 偶数 长 度 的 圈 2 
5 奇数 长 度 的 图 3 
6 二 部 图 2 





完全 子 图 称 为 团 。 有 7r 个 顶点 的 团 C 称 为 六 团 。 如 果 不 存 在 包含 团 C 的 其 他 团 ， 则 称 团 C 是 
极 大 的 。 顶 点 数 最 大 的 极 大 团 称 为 最 大 团 。 最 大 团 的 顶点 数 称 为 团 数 。 为 了 给 一 个 斑 团 染 色 ， 
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我 们 需要 r 种 颜色 ， 因 此 色 数 > 团 数 。 


2.3.8 团 覆 盖 
图 G = (V,E) 的 田 益 盖 是 指 将 V 划 分 成 Vi,V;,… ,Vi.， 使 得 每 个 V 都 是 一 个 团 。 图 2-38 给 出 了 
图 G 的 两 个 不 同 的 团 覆 盖 。 
团 覆盖 1 ” ” 团 覆 盖 2 
V,= {1} V = {1,2} 
Vv, = {10} V,= {3,4,5} 
V = {2,8,9} V; = {6,7,8} 
V,= {6,7} V, = {9,10} 
V; = {3,4,5} 





图 2-38 团 得 盖 为 {1,2},{3,4, 5},{6,7, 8}, {9, 10} 的 图 

团 覆 盖 {Vi,V,… ,Vi} 的 容量 指 划 分 的 集合 数 k。 容 量 最 小 的 团 和 覆盖 称 为 最 小 团 徐 差 。 对 于 
图 G = (V,B) 的 一 个 顶点 集 X， 如 果 X 中 的 任何 两 个 顶点 都 不 相 邻 ， 则 称 X 为 独立 全 。 独 立 集 也 
称 为 稳定 集 (stable set)。 对 于 任 一 不 在 X 中 的 顶点 v，XU{v} 不 是 独立 集 ， 则 称 X 是 V 的 极 大 独 
立 集 。 顶 点 数 最 大 的 极 大 独立 集 称 为 最 大 独立 集 。 

对 于 图 2-38， 我 们 给 出 如 下 的 独立 集 : 

Xi={1,4,8,10} X={1,10,6,3} X={8,4} X={1,7,10} 

其 中 X, 和 X, 是 最 大 独立 集 。 最 大 独立 集中 的 所 有 顶点 用 相同 的 颜色 染色 ， 团 中 的 每 一 个 顶点 用 
不 同 的 颜色 染色 。 


2.3.9 交 图 
设 F 是 一 个 子 集 族 ， 对 图 G = (V, ) 构 造 如 下 : 顶点 集 V 与 F 中 的 子 集 一 一 对 应 。 对 于 V 中 的 
两 个 顶点 ， 当 且 仅 当 与 它们 相对 应 的 两 个 {2,3,4,5,6} 
子 集 有 非 空 交集 上 时， 这 两 个 顶点 相 邻 。 这 P， Pp, P。 
样 由 F 构 造 出 来 的 图 G 称 为 F 的 交 图 。 ~ 
设 F = {Pi,PyPyPwP;}， 这 里 P, = 《123 
{1,2,3}, P,= {2,3,4,5,6}, P,= {5,6}, P,= p, ‘6.7.8.9) 
{6,7,8,9}，P; = {4,10}。F 的 交 图 如 图 2-39 {5,6) 


所 示 。 图 2-39 F= {P,P,,P;,Ps,P;} 的 交 图 





66 第 一 部 分 并 行 夺 侣 基础 





2.3.10 弦 图 


设 {yiw2.… ve) 是 图 的 一 个 圈 ,， 连接 两 个 不 相 邻 的 顶点 风 和 胞 的 任 一 条 边 称 为 节 (chord )。 
设 + 是 图 的 一 个 顶点 ，ADJ(x) 是 与 x 相 邻 的 所 有 顶点 的 集合 ， 即 一 个 团 。 我 们 称 x 是 单纯 的 
(simplicial )。 如 果 图 中 每 一 个 长 度 大 于 3 的 简单 图 有 一 个 续 , 则 称 该 图 为 纹 图 (chordal graph )。 
顶点 序列 v4,v,… wv 称 为 完美 消去 序列 (PEO) 或 完美 消去 格式 (PES)( 当 且 仅 当 对 所 有 i， 由 
{vv 导出 的 图 中 的 v; 是 单纯 的 )。 例 如 ， 图 2-40 给 出 了 弦 图 G 及 一 个 PEO。 在 这 个 图 中 ， 
{vssv2sV8} 是 一 个 Vi-vo 分 离 集 ，{vs,v;} 是 一 个 极 小 va-ve 分 离 集 。 假定 4={1}, B= {1},C={1,2},D 
= {2,3}, = {3,4}, FF= {4,5}, G = {3,4,5}, H = {5}。 考 虑 子 集 族 F = {4,B8,C,D,E,F,G,H}, 『F 的 
交 图 。 如 图 2-40 所 示 ， 其 中 v, =A,v,=B,v;=C,v=D,v=E,v=F,v,=G,v=H。 


Vi 





图 2-40 兹 图 及 PEO 


弦 图 是 树 的 子 树 的 交 图 。 存 在 一 个 无 向 树 7， 子 树 族 F = {5,,52…,5,}， 从 F 到 V 的 双 射 并 具 
有 如 下 性 质 : G 中 两 个 顶点 相 邻 当 且 仅 当 相应 的 两 个 子 树 有 公共 顶点 。 给 定 一 个 路 图 C， 构 造 
一 个 树 使 得 7 的 顶点 集 则 构 于 G 的 极 大 团 集合 。7 的 边 构 造 如 下 : 对 于 G 中 任 一 顶点 v， 与 包含 v 
的 团 相 应 的 顶点 导出 7 的 一 个 子 树 ， 这 样 构造 出 来 的 树 称 为 弦 图 G 的 团 树 。 例 如 ， 考 虑 图 2-41a 
所 示 的 弦 图 G， 图 的 顶点 集 Y = {1,2,3,4;5,6,7,8,9,10}， 极 大 团 为 Ci = {12,3}, C= {2,3.4}, C;= 
{1,5,6}, Cs = {57}, Cs; = {1,8,9}, C6 = {8.9,10}。G 的 团 树 如 图 2-41lb 所 示 。 弦 图 广泛 应 用 于 各 
个 领域 ， 如 稀 下 线性 方程 组 的 求解 、 进 化 树 的 研究 、 设 备 定位 问题 等 。 关 于 弦 图 有 如 下 性 质 : 

定理 2-6 下 列 叙 述 是 等 价 的 : 
.CC 是 弦 图 ; 
2. G 有 一 个 PEO; 
.G 可 通过 下 面 的 递归 构造 原理 得 到 : 
a. 从 任 一 个 作为 基 图 的 团 开 始 ， 团 是 一 个 蓄 图 ， 
b. 对 于 蓄 图 万， 增加 一 个 新 的 顶点 并 使 得 它 与 互 的 一 个 团子 图 相 令 ; 
4. G 的 每 一 个 极 小 分 离 集 导出 G 的 一 个 团 ; 
5.G 是 树 的 子 树 族 的 交 图 ， 
6. G 的 每 一 个 诱导 子 图 或 者 是 一 个 团 ， 或 者 包含 两 个 不 相 令 的 单纯 顶点 ， 
7. 含有 两 个 或 更 多 顶点 的 图 G 的 每 一 个 连通 诱导 子 图 至 多 含有 n 一 1 个 团 。 
针对 蓄 图 识别 的 串 行 算 法 利用 各 种 被 称 为 PEO 格 式 的 过 程 来 生成 PEO。 
下 面 我 们 给 出 一 些 文献 中 提 及 的 PEO 格 式 : 
1. 字典 顺序 宽度 优先 搜索 (LBFS ) ; 
2. 最 大 基数 搜索 (MCS) ; 


et 
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3. 分 支 中 的 极 大 元 素 (MEC ) ; 
4. 分 支 中 的 最 大 基数 邻 域 (MCC )。 





Cs 


b) 
图 2-41 
a) 弛 图 C_ b) G 的 团 树 


下 面 定理 表明 了 识别 苞 图 时 PEO 格 式 的 重要 性 。 

定理 2-7 当 且 仅 当 由 PEO 格 式 LBFS、MCS、MEC、MCC 产 生 的 G 的 顶点 序列 是 一 个 PEO 
时 ， 图 G 是 一 个 蓄 图 。 且 测定 图 的 发 所 用 的 时 间 为 O(m+tn)。 

弦 图 的 PEO 已 经 成 为 品行 算法 的 关键 技术 ， 而 对 于 PEO 的 研究 已 经 产生 了 许多 重要 的 算 
法 思想 。 然 而 并 行 算法 的 研究 人 员 大 都 放弃 了 对 PEO 的 使 用 。Chandrasekhar 和 Iyengar 给 出 了 
利用 极 小 团 分 离 集 识 别 弦 图 的 NC 并 行 算 法 ，Edenbrandt 也 给 出 了 类 似 的 方法 。 而 Naor 和 
Schiffer 则 给 出 了 利用 PEO 技 术 的 NC 并 行 算法 ，Dahlhaus 和 Karpinski 也 各 自 独 立 给 出 了 同样 的 
NC 并 行 算法 。 这 些 算法 都 需要 O(n 个 处 理 器 。Klein 的 算法 比较 好 ， 在 CRCW PRAM 模 型 中 
只 需 O(n) 个 处 理 器 ， 而 执行 时 间 为 O(log n)。 

路 图 “ 弦 图 的 交 图 表示 启发 研究 人 员 去 研究 更 多 类 型 的 交 图 。Monma 和 Wei 已 经 研究 了 儿 
类 起 源 于 树 的 路 族 的 交 图 。 一 条 路 如 果 把 它 看 作 是 顶点 的 集合 ， 则 称 为 顶点 路 ; 两 条 顶点 路 
如 果 有 公共 顶点 ， 则 称 为 有 非 空 交集 。 一 条 路 如 果 把 它 看 作 是 边 的 集合 ， 则 称 为 边 路 ;如 果 
两 条 边 路 有 公共 边 ， 则 称 它们 有 非 空 交集 。 在 无 向 树 中 无 向 顶点 路 族 的 交 图 称 为 无 向 顶点 路 
图 或 UV 图 。 在 Monma 和 Wei 所 用 的 术语 中 ， 树 可 以 是 有 向 的 或 者 是 有 根 有 向 的 ; 图 可 以 是 有 
向 的 、 无 向 的 或 有 根 有 向 的 。 基 于 此 路 图 的 可 能 类 型 有 6 种 : 

1. 有 向 顶点 路 图 (DV 图 ) ; 
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2. 无 向 顶点 路 图 (UV 图 ) ; 

3. 有 根 有 向 顶点 路 图 (RDV 图 ) ; 

4. 有 向 边 路 图 (DE 图 ) ; 

5. 无 向 边 路 图 (UE 图 ) ; 

6. 有 根 有 向 边 路 图 (RDE 图 )。 

Monma 和 Wei 证 明 这 6 种 类 型 中 的 任 一 个 图 都 可 用 适当 类 型 的 团 树 来 表示 ， 相 应 的 团 树 的 

[多 ] 顶点 用 G 的 团 标识 。 为 了 识别 RDV 图 ，Dietz 给 出 了 一 个 线性 时 间 串 行 算法 。 为 了 识别 UV 图 ， 
Gavril 给 出 了 第 一 个 关于 交 图 表示 的 算法 ， 执 行 时 间 为 O(n)。Schiiffer 给 出 了 一 个 较 快 的 识别 
UV 图 的 算法 ， 执 行 时 间 为 O(mn)。Xavier 则 给 出 了 识别 UV 图 的 NC 并 行 算法 。 

区 间 图 一 个 图 如 果 是 实 轴 上 区 闻 族 的 交 图 ， 则 称 为 区 间 图 。 下 面 给 出 描述 区 间 图 特征 的 
定理 。 

定理 2-8 下 面 叙述 是 等 价 的 : 

a. G 是 一 个 区 间 图 ; 

b. G 是 实 轴 上 区 间 族 的 交 图 ; 

c. G 是 一 个 蓄 图 ， 且 它 的 极 大 团 可 以 被 线性 排序 对 于 G 的 每 一 个 顶点 xX， 包含 x 的 极 大 团 
连续 出 现 。 

图 2-42 分 别 展 示 了 一 个 区 间 图 ， 它 的 区 间 表 示 以 及 极 大 团 的 线性 序列 。 它 的 极 大 团 分 别 
是 C, = {a,b,c}, C, = {c,d,g8}, C; = {ce8}, C; = {cf,8}。Booth 和 Lucker 证 明了 用 串 行 算法 识别 
一 个 区 间 图 的 时 间 为 Olm+n)。 他 们 引入 了 称 作 PQ- 树 ( 见 图 2-43) 的 数据 结构 。PQ- 树 是 一 个 
非常 有 用 的 数据 结构 ， 它 可 用 来 表示 区 闻 图 极 大 团 的 所 有 可 能 的 线性 定向 。PQ- 树 是 有 根 有 向 
树 ， 它 有 三 种 类 型 的 节点 : 

1. 叶子 : PQ- 树 的 叶子 是 被 操作 的 对 象 。 在 区 间 图 识别 中 ， 叶 子 表示 图 的 极 大 团 。 

2.P- 节 点 : P- 节 点 是 内 部 节点 ， 它 至 少 有 两 个 孩子 并 且 用 圈 来 表示 。 

3.Q- 节 点 : Q- 节 点 是 内 部 节点 ， 它 至 少 有 两 个 孩子 并 且 用 拢 形 来 表示 。 

考虑 两 个 PQ- 树 T 和 7T'"， 如 果 存 在 一 个 由 下 面 的 变换 组 成 的 序列 ， 这 些 变换 使 得 T 变 成 7'， 
则 称 T 和 7T' 等 价 ， 并 记 为 T=T'。 

1. 任意 变换 P- 节 点 的 孩子 的 顺序 ; 

2. 颠倒 Q- 节 点 的 孩子 的 顺序 。 


f 

a) 
图 2-42 
a) 区 间 图 G 
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图 2-42〈 续 ) 
b) G 的 区 间 表 示 c) G 的 极 大 团 的 线性 序列 


图 2-43 PQ- 树 


显然 ，= 表示 等 价 关系 。 对 于 任何 有 序 树 7T， 其 顶点 vy 的 边界 (frontier) 指 叶子 序列 ， 这 
些 叶 子 是 顶点 v 的 子 代 。 在 叶子 序列 中 ， 叶 子 a 先 于 叶子 6。， 当 且 仅 当 a 和 5 有 公共 祖先 c<， 使 得 
由 c 到 ec 的 路 上 c 的 孩子 先 于 由 c 到 2 的 路 上 c 的 孩子 。 换 句 话 说， 顶点 的 边界 是 叶子 序列 ， 这 些 
叶子 被 以 "为 根 的 子 树 遍历 。 如 果 7 是 一 个 有 序 树 ， 则 FRONTIER(T) = FRONTIER(ROOT(7))。 
对 于 PQ- 树 T， 我 们 定义 CONSISTENT (7) = {FRONTIER(7T):T' E 7T}。 即 树 T 的 CONSISTENT 
是 由 PQ- 树 7 表示 的 所 有 可 能 的 叶子 序列 的 集合 。 很 容易 证 明 下 面 的 定理 。 

定理 2-9 如 果 Z 和 Z' 是 PO- 树 ， 当 且 仅 当 CONSISTENT (Z) = CONSISTENT(ZD) 时 ,，Z = 2'。 

假设 7 是 PQ- 树 ， 它 的 叶子 节点 是 集合 C 的 元 素 。C 是 C 的 子 集 ，Booth 和 Lueker 给 出 了 一 
个 REDUCE 程 序 ， 使 得 CONSISTENT (REDUCE(T,C)) = {oE CONSISTENT(T): C 的 元 素 在 o 
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中 是 连续 的 }。 他 们 也 证 明了 n 个 元 素 集 C1,C;,,…,C, 需 要 调用 REDUCE 程 序 0(p+ 了》"%p,) 次 ， 
这 里 p = ICl, p, = ICI。 设 C 是 弦 图 G = (V, E) 的 极 大 团 的 集合 ，V = {ww jy。 假定 包含 w 的 
极 大 团 的 集合 用 C 表 示 。 由 定理 2-9 可 知 ， 区 间 图 的 识别 问题 归结 为 PQ- 树 的 生成 问题 ， 树 的 
叶子 取 自 C， 且 对 集合 C', C,,…, C, 需 要 调用 n 次 REDUCE 程 序 。 极 大 团 的 数目 至 多 是 %。 包 含 
项 点 v 的 团 的 数目 至 多 是 它 的 度数 且 图 的 所 有 顶点 的 度 的 总 和 是 2m。 寻 找 弦 图 的 极 大 团 所 用 的 
串 行 时 间 是 Olm+n)， 因 此 ， 识 别 区 间 图 所 用 的 串 行 时 间 是 Ol(m+n)。 

Klein 和 Reif 设 计 了 另 一 种 运算 一 一 MREDUCE({C,, C;…, Cn})。 这 个 运算 间 时 相应 于 所 
有 的 集合 C,， 可 导出 PQ- 树 7。 他 们 也 给 出 了 此 问题 的 并 行 实现 方法 ， 这 里 C, 是 两 两 不 相交 的 。 
并 行 算法 共 需 处 理 器 数 为 0(n)， 执 行 时 间 为 O(log 四。 


2.3.11 更 多 的 交 图 


Scheinerman 刻 画 了 交 图 类 的 特征 。 他 定义 了 一 种 叫做 顶点 扩展 的 图 运算 。 除 了 增加 一 个 
新 的 顶点 v 外 ， 在 v 点 扩展 的 图 与 图 G 相 同 ， 与 此 同时 ，v' 与 v 及 v 的 每 一 个 邻 点 都 相 邻 。 这 里 我 
们 给 出 一 个 定理 。 

定理 2-10 F 是 交 图 类 ， 当 且 仅 当 以 下 叙述 是 正确 的 : 

i.F 是 遗传 的 ， 即 F 中 图 的 每 一 个 诱导 子 图 都 在 F 中 ; 

ii. 在 顶点 扩展 运算 下 ，F 是 封闭 的 ; 

iii, 如 果 人 ,和 G, 都 在 F 中 ， 则 存在 一 个 图 G EE F， 使 得 G1/ 和 G, 是 G 的 诱导 子 图 。G, 和 G5 的 顶 
点 集 可 以 相交 。 

如 果 图 C 的 每 一 个 诱导 子 图 瓦 的 最 大 独立 集 的 顶点 个 数 等 于 最 小 团 覆 盖 的 困 的 个 数 ， 则 称 
G 是 完美 的 (perfect)。 

一 些 交 图 如 区 间 图 、UV 图 、RDV 图 和 纱 图 都 是 完美 的 ， 本 节 我 们 将 给 出 更 多 的 交 图 。 

圈 的 蕊 族 的 交 图 称 为 圈 图 。 如 何 有 效 地 识别 圈 图 的 问题 多 年 来 一 直 是 一 个 难题 ， 但 
最 后 它 几 乎 同时 被 三 个 独立 的 研究 小 组 解决 了 。 

奇偶 图 和 距离 遗传 图 对 于 图 G 中 的 任 一 对 顶点 a 和 b5， 如 果 从 a 到 5b 的 所 有 导出 路 具有 相同 
的 长 度 ， 则 称 G 是 距离 遗传 图 。 如 果 路 的 长 度 是 偶数 ， 则 称 从 a 到 5b 的 导出 路 是 偶 长 的 (even 
parity )。 同 样 可 以 定义 奇 长 的 路 (odd parity)。 在 图 G 中 ， 对 于 任何 两 个 项 点 a 和 4b， 如 果 a, b 
间 的 所 有 导出 路 具有 相同 的 奇偶 性 ， 则 称 G 是 村 偶 图 。 由 定理 2-10， 上 面 定 义 的 两 个 图 都 是 
交 图 。 

圆 弧 图 轿 的 弧 的 集合 的 交 图 称 为 圆 弧 图。 每 一 个 区 间 图 都 是 圆 弧 图 。 然 而 ， 有 些 圆 弧 图 
甚至 还 不 是 蓄 图 。 





2.3.12 图 的 匹配 问题 


给 定 图 G = (V,E)， 边 集 M 中 的 任何 两 条 边 都 不 与 同一 个 顶点 相关 联 ， 则 MM 称 为 匹配 。 如 果 
Gov) € M， 我 们 说 4 和 v 在 M 中 是 匹配 的 。 如 果 一 个 匹配 不 包含 在 另 一 个 匹配 中 ， 则 这 个 匹配 
称 为 极 大 匹配 。 边 数 最 多 的 匹配 称 为 最 大 匹配 。 图 G = (V.E) 的 匹配 M 如 果 匹 配 了 图 G 中 除了 一 
个 顶点 外 的 所 有 顶点 ， 则 称 为 完美 匹配 。 当 且 仅 当 IMI = [n/2] 时 ，M 是 完美 匹配 。 当 给 图 的 边 
赋 权 时 ， 我 们 定义 M 中 边 的 成 本 总 和 为 匹配 的 成 本 (Cost of the matching )。 我 们 感 兴趣 的 是 
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寻找 最 小 (或 最 大 ) 成 本 的 完美 匹配 。 匹 配 问 题 在 许多 方面 都 有 应 用 。 工 人 与 工作 相 匹 配 ， 
机 器 与 部 件 相 匹配 ， 运 动员 与 运动 队 相 匹配 等 。 

Wu 和 Manper 已 经 引入 了 匹配 问题 的 推广 。 设 G = (V,E) 是 一 个 加 权 图 ，G 中 的 路 匹配 是 
指 具有 不 同 端点 的 简单 路 的 集合 。 匹 配 是 路 匹配 的 一 个 特例 。 在 匹配 中 所 有 的 路 恰 由 一 条 边 
组 成 。 

假定 P 是 6G 的 一 个 路 匹配 ， 如 果 IPl = [n/2]， 则 称 路 匹配 P 是 完美 的 。 如 果 G 含 有 奇数 个 顶 
点 ， 完 美 路 匹配 只 剩 一 个 顶点 未 匹配 。 如 果 G 含 有 偶数 个 顶点 ，G 的 所 有 顶点 均 在 完美 路 匹配 
中 所 匹配 。 在 C 的 路 匹配 中 ， 如 果 任 何 两 条 路 都 是 边 不 相交 的 ， 则 称 为 边 不 相交 的 路 匹配 。 
Wu 和 Manber 已 经 证 明了 下 面 这 个 引 理 。 

引 理 每 一 个 无 向 图 至 少 有 一 个 边 不 相交 的 完美 路 匹配 。 

作为 路 匹配 的 一 个 应 用 ， 我 们 假定 G 是 一 个 计算 机 网 络 模型 ， 使 得 每 一 个 顶点 对 应 一 台 计 
算 机 ， 每 一 条 边 对 应 一 条 通讯 链 。 每 一 条 链 上 对 应 一 个 成 本 〈 如 负载 ， 运 费 ， 延 迟 )。 进 一 步 
假定 我 们 想 在 计算 机 间 组 织 一 场 比赛 ， 使 得 每 一 台 计 算 机 和 另外 一 台 配 对 共同 完成 某 个 竞赛 。 
路 表示 与 端点 相应 的 计算 机 对 。 下 面 我 们 列 出 各 种 路 匹配 问题 。 

最 小 和 路 匹配 设 G = (V,E) 是 一 个 加 权 图 ，P 是 G 的 一 个 完美 路 匹配 。 路 的 成 本 指 路 的 所 
有 边 的 权 之 和 。P 中 路 的 所 有 成 本 之 和 称 为 P 的 成 本 和 。 求 具有 最 小 成 本 和 的 完美 路 匹配 问题 
称 为 最 小 和 路 匹配 问题 。 假 定 用 CO(m) 串 行 执行 时 间 去 寻找 树 的 最 小 和 路 匹配 。 对 于 一 般 图 ， 
存在 这 样 一 个 最 小 和 路 匹配 ， 它 含有 每 条 至 多 有 两 条 边 的 路 。 通 过 计算 所 有 的 最 短路 〈 至 多 
两 条 边 ) 以 及 求 最 小 匹配 可 以 得 到 最 小 和 路 匹配 。 

最 小 最 大 路 匹配 ”完美 路 匹配 P 的 最 大 成 本 是 指 P 中 路 的 最 大 成 本 。 具 有 最 小 的 最 大 成 本 
的 完美 路 匹配 称 为 最 小 最 大 完美 路 匹配 ， 这 个 问题 也 称 为 瓶颈 问题 (bottle-neck problem ) 。 
我 们 称 边 不 相交 的 完美 路 匹配 为 DP- 匹 配 。Wu 和 Manber 已 经 给 出 了 一 个 求 整数 加 权 树 的 最 小 
最 大 DP- 匹 配 的 串 行 算法 ， 其 执行 时 间 为 On log d log w)， 这 里 d 表 示 顶 点 的 最 大 度 ，w 表 示 边 
的 最 大 成 本 。Xavier(1995) 给 出 了 求 树 的 最 小 最 大 PDP- 匹配 的 并 行 算法 。 


2.3.13 图 的 中 心 


图 G 的 两 个 顶点 x 和 v 的 距离 是 指 从 w 到 v 的 路 中 的 最 小 边 数 ， 记 为 d(u,v)。 如 果 G 是 加 权 图 ， 
dluwv) 表 示 从 u 到 v 的 最 短路 的 长 度 。 顶 点 v 的 距离 定义 为 从 v 到 所 有 顶点 的 距离 之 和 ， 记 为 4(v)， 
即 有 


d(v) = > d(v,u) 


G 中 具有 最 小 距离 的 顶点 称 为 G 的 重心 (median )。 每 个 树 含有 一 个 或 两 个 重心 ， 如 果 含 有 两 
个 重心 则 这 两 个 重心 必 相 邻 。 

树 7 在 顶点 v 的 分 枝 指 包含 v 且 把 v 作 为 叶子 节点 的 最 大 子 树 。 在 顶点 v 的 所 有 分 枝 中 ,分 枝 
所 具有 的 最 大 边 数 称 作 分 枝 权 重 。 记 为 B(v)。 也 可 以 说 ， 顶 点 v 的 分 枝 权 重 是 7-v 的 任 一 分 枝 中 
顶点 的 最 大 数目 。 如 果 Z 的 某 个 顶点 的 分 枝 权重 函数 是 最 小 的 ， 这 样 的 顶点 称 为 7 的 形 心 
(centroid )。 对 于 任 一 树 7， 当 且 仅 当 一 个 顶点 是 形 心 时 ， 它 是 树 的 重心 。 

求 中 心 、 重 心 和 形 心 已 经 应 用 于 许多 关于 设备 定位 (facility location) 的 问题 中 。 例 如 ， 
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假定 图 G 的 顶点 表示 一 些 村 庄 ， 边 表示 连接 村 上 庄 的 路 ， 边 的 权 表 示 两 个 村 庄 之 间 的 距离 。 假 定 
我 们 要 挑选 一 个 村 庄 来 建造 一 所 医院 供 所 有 村 上庄 使 用 .如 果 我 们 选择 G 的 中 心 作为 医院 的 位 置 ， 
我 们 可 以 减少 病人 移动 的 最 大 距离 。 如 果 图 的 顶点 表示 一 个 公司 的 各 个 分 部 ， 经 理想 找 一 个 
顶点 作为 年 会 的 会 议 地 点 ， 那 么 感 兴趣 的 会 是 图 的 重心 ， 这 样 可 以 减少 各 个 分 部 经 理 所 付 的 
总 路 费 。Slater 提 议 推 广 这 些 概 念 ， 使 得 设备 定位 在 某 个 结构 上 而 不 是 某 个 单一 顶点 上 。 他 提 
议 采 用 中 心路 结构 。 
中 心路 ”从 顶点 v 到 一 条 路 P 的 距离 定义 为 

. d(v,P) = Min{d(v,u)/u € P} 
路 P 的 离心 率 定义 为 

e(P) = Max{fd(v,P)vE TV 
对 于 具有 最 小 离心 率 的 路 P， 如 果 具 有 相同 离心 率 的 其 他 路 都 长 于 PP， 则 P 称 为 中 心路 。 路 P 的 
距离 和 定义 为 

d(P) = 之 ad(v,P) 


有 具有 最 小 距离 和 的 路 称 为 G 的 核心 (core )。 两 个 独立 的 研究 小 组 已 经 给 出 了 求 树 网 络 核心 的 
NC 并 行 算法 。 
2.3.14 控制 理论 


考虑 图 G = (V,E)，D 是 G 的 一 个 顶点 集 。 如 果 每 一 个 不 在 PD 中 的 顶点 都 与 D 中 的 某 个 元 素 
相 邻 ， 则 称 D 为 图 G 的 控制 集 。 我 们 说 D 控 制图 G。 考 察 图 2-44， 它 的 两 个 控制 集 为 D, = 
{1,4,7}, D;= {1,5}。 


1 2 
4 3 
5 6 
7 
图 2-44 图 G 


这 里 有 许多 不 同类 型 的 应 用 。 考 虑 一 个 公司 ， 它 有 ?7 个 主管 。 如 果 主 管 才 的 人 际 关 系 较 
好 ， 我 们 就 在 i 与 j 之 间 连 一 条 边 。 如 图 2-44 所 示 ， 它 表示 公司 7 个 主管 之 间 的 人 际 关 系 。 
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假定 公司 想 组 建 一 个 委员 会 去 执行 一 个 计划 ， 该 计划 需要 公司 7 个 主管 的 合作 。 而 这 个 委 
员 会 的 成 员 必 须 与 不 在 委员 会 中 的 人 有 良好 的 人 际 关系 ， 换 句 话 说， 对 于 不 在 委员 会 里 的 人 ， 
委员 会 里 至 少 有 一 个 人 和 他 关系 较 好 ， 因 此 这 个 委员 会 就 是 一 个 控制 集 。 

对 于 一 个 控制 集 ， 如 果 它 不 包含 其 他 控制 集 ， 则 称 之 为 极 小 控制 集 。 含 有 最 小 顶点 数 的 
极 小 控制 集 称 为 最 小 控制 集 。 最 小 控制 集 的 顶点 个 数 称 为 图 的 控制 数 (domination number)。 
我 们 注意 到 每 一 个 极 大 独立 集 都 是 一 个 控制 集 。 如 果 控 制 集 是 一 个 圈 ， 则 称 之 为 控制 图 
(dominating cycle)。 类 似 地 ， 如 果 一 个 控制 集 是 完全 的 (独立 的 )， 则 称 之 为 完全 (独立) 控 
制 集 。 图 G = (V,E) 的 强 控 制 数 是 指 这 样 的 一 个 最 小 整数 s;， 它 使 得 G 的 每 一 个 含 :个 顶点 的 集合 
都 是 一 个 控制 集 。 

D 是 一 个 顶点 集 。 如 果 V-D 中 的 每 一 个 顶点 v 都 与 D 中 至 少 k 个 元 素 相 邻 ， 则 称 D 为 -控制 集 
(这 里 Kk 是 正 整 数 )。 如 果 (x,y) 是 一 条 边 ， 且 满足 degree(x) > degree(y)， 那 么 我 们 说 + 强 控 制 y>，y 
弱 控 制 x。 强 控制 和 弱 控 制 的 概念 在 文献 中 也 出 现 过 。 不 含 孤 立 点 的 控制 集 称 为 全 控制 集 。 换 
句 话说 ， 对 于 V 的 一 个 子 集 D， 如 果 G 的 每 一 个 顶点 与 D 中 至 少 一 个 顶点 相 邻 ， 则 称 D 是 全 控制 
集 。 图 G = (V,E) 的 domatic 划 分 是 指 V 的 这 样 一 个 划分 ， 其 中 的 每 一 个 元 素 是 G 的 控制 集 。 图 G 
的 domatic 划 分 中 ， 元 素 的 最 大 个 数 称 为 图 G 的 domatic 数 。Cockayne 和 Hedetnemi (1977) 引入 
并 研究 了 这 个 概念 。Neeralagi (1988) 定义 了 图 G = (VY,E) 的 奇 ( 偶 ) 控制 集 ， 它 是 顶点 集 D， 
V-D 中 的 每 一 个 顶点 与 D 中 的 某 一 顶点 之 间 的 距离 为 奇 ( 偶 ) 数 。 

Slater, Banger 和 Barkauskas 研 究 了 有 效 控制 的 概念 。 对 于 图 G = (V,) 的 一 个 顶点 集 D， 如 
果 V-D 中 的 每 一 个 顶点 4 恰好 与 D 中 的 一 个 顶点 相 邻 ， 则 称 D 是 有 效 控制 集 。 Cockayne 等 人 
(1988) 也 研究 了 图 的 有 效 控制 问题 。 


2.3.15 图 论 中 的 一 些 问题 


这 一 节 我 们 介绍 图 论 中 的 一 些 问 题 ， 在 文献 中 已 研究 过 这 些 问题 的 算法 。 

1. 最 大 独立 集 问题 : 求 图 G 的 最 大 独立 集 。 

2. 最 小 染色 问题 : 求 图 的 色 数 。 

3. 最 大 团 问 题 : 求 给 定 图 的 最 大 团 。 

4. 最 小 团 覆 盖 问 题 : 求 给 定 图 的 最 小 团 覆 盖 。 

5. 同 构 问 题 : 给 定 两 个 图 G, G'， 判 断 G 和 C 是 否 同 构 。 

6. 子 图 同 构 问 题 : 给 定 两 个 图 G, G'， 其 中 G 的 顶点 数 多 于 G 的 顶点 数 ， 判 断 G 是 否 有 与 G- 
同 构 的 诱导 子 图 。 

7. 最 大 公共 子 图 问题 : 令 G 和 G 是 两 个 图 ， 显 然 G 和 C 都 有 同 构 于 天 的 子 图 。 如 果 G "是 一 
个 图 ， 使 得 G 与 G' 有 同 构 于 G" 的 诱导 子 图 ， 我 们 就 说 G" 是 G 和 G' 的 公共 子 图 。 给 定 G 和 G'， 求 
G 和 G' 的 包含 最 大 顶点 个 数 的 公共 子 图 。 

8. 哈密 顿 问题 : 判断 一 个 图 是 否 有 哈密 顿 圈 。 

9. 控制 问题 ， 给 定 一 个 图 G， 求 极 小 控制 集 、 全 控制 集 、 控 制 圈 、 连 通 控 制 集 、 控 制 团 等 。 

10. 连通 支 问题 : 给 定 一 个 图 G， 判 断 G 是 否 连通 ， 如 果 G 是 不 连通 的 ， 求 C 的 连通 支 。 类 
似 地 ， 判 断 它 是 否 是 2- 连 通 的 ， 如 果 不 是 ， 求 G 的 2- 连 通 支 。 

11 .匹配 问题 : 给 定 一 个 图 G， 求 最 大 匹配 。 

12. 路 匹配 问题 ; 求 最 小 成 本 的 路 匹配 问题 是 一 类 。 在 路 匹配 中 ， 极 小 化 路 的 最 大 权重 是 
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另 一 类 路 匹配 问题 。 

13. 最 长 路 问题 : 在 给 定 的 图 中 ， 求 最 长 简单 路 。 在 树 中 ， 最 长 路 也 称 为 直径 。 

14. 核心 和 双核 心 问题 :加 权 图 的 核心 是 这 样 一 条 路 ， 它 满足 从 这 条 路 到 所 有 顶点 的 距离 
之 和 最 小 。 双 核心 是 一 对 路 ， 它 满足 从 其 中 任 一 条 路 到 各 顶点 的 距离 之 和 最 小 。 

15. 路 覆盖 问题 : 图 C 的 路 覆盖 是 指 简单 路 的 集合 ， 使 得 G 的 每 一 个 顶点 都 在 一 条 路 上 。 
求 覆盖 图 的 最 小 路 数 。 

16. 识别 问题 : 在 设计 有 效 算法 过 程 中 ， 带 有 限制 的 图 类 是 很 重要 的 。 这 些 带 有 限制 的 图 
类 的 结构 性 质 可 以 被 用 来 设计 并 行 和 串 行 算法 。 各 种 各 样 带 限制 的 图 类 的 识别 问题 在 文献 中 
受到 相当 的 重视 。 


参考 文献 


Bondy, J. A., and Murty, U. S$. R. (1976) Graph Theory with Applications, North- 
Holland, New York. 


Joseph, J. J. (1972). Introduction IO Parallel Algorithms, Addison-Wesley, Reading, 
MA. 

Johnson, D. S$. (1985). The NP-completeness column: An ongoing guide. J. Algorithms. 
6, 434-451. 

Klein, P. N. (1988). Efficient Parallel Algorithms for Planar, Chordal and Interval 
Graphs. TR 426 (Ph.D. Thesis) Laboratory for Computer Science, MIT, Cambridge, 
MA. 

Samy, A., Arumugam, G., Devasahayam, M. P, and Xavier, C. (1991). Algorithms for 
Intersection Graphs of Internally Disjoint Paths in Trees, Proceedings of National 
Seminar on Theoretical Computer Science, IMSC, Madras, India, Report 115, pp. 
169-178. 

Berge, ©C. and Chvatal, C. eds. (1984). Topics on Perfect Graphs, Annals of Discrete 
Mathematics, 21. 

Sekharan, N. C. (1985). New Characterizations and Algorithmic Studies on Chordal 
Graphs and k-Trees, M.Sc. (Engg.) thesis, School of Automation, Indian Institute of 
Science, Bangalore. 

Chandrasekharan, N. and Iyengar, S. (1988). NC Algorithms for Recognizing Chordal 
Graphs and k-Trees, IEEE Transactions on Computers, 37(10). 

Joseph, J. A. (1992). Introduction to Parallel Algorithms, Addison-Wesley, Reading, 
MA. 

Kelly, D. (1985). Comparability graphs. In I. Rival, ed., Graphs and Order, pp. 3-40. 
D. Reidel, Dordrecht. (NATO ASI series C, v. 14.) 

Klein, P. N. (1988). Efficient Parallel Algorithms for Chordal graphs, Proc. 29th [EEE 
Symposium on Foundation of Computer Section pp. 150-161. 

Klein, P. N. (1988). Efficient Parallel Algorithms for Planar, Chordal and Interval 
Graphs, TR 426 (Ph.D. thesis), Laboratory for Computer Science, MIT, Cambridge, 
MA. 

Kozen, D., Vazirani, U. V., and Vazirani, V. V. (1985). NC Algorithms for Compa- 
rability Graphs, Interval Graphs and Unique Perfect Matchings. In Fifth Confer- 
ence on Foundations of Softrware Technofogy and Theoretical Computer Science, 
pp. 496-503, New York and Berlin. (Springer Lecture Notes in Computer Science 
206.) 

Moitra, A. and Iyengar, S. S. (1987). Parallel Algorithms for Some Computational Prob- 
lems, Advances in Computers, 26, 93—153. 

Manacher, G. K. (1992) Chord Free Path Problems on Interval Graphs, Computer Sci- 


蔓 2 蓝 并 厅 矿 划 数据 结构 








ence and Informatics, 22,(2) 17--24. 

Mohring, R. H. (1984). Algorithmic Aspects of Comparability Graphs and Interval 
Graphs. In Ivan Rival, ed., Graphs and Order, pp. 41-101. D. Reidel, Dordrecht 
(Nato ASI series C, v. 147.) 

Xavier C. and Arumugam, G. (1994). Algorithms for Parity Path Problems in Some 
Classes of Graphs, Computer Science and Informatics, 24(4) 50—54. 

Xavier. C. (1995). Sequential and Parallel Algorithms for Some Graph Theoretic Prob- 
lems (Ph.D. thesis). Madurai Kamaraj University. 


73 





第 3 章 并 行 算法 设计 环境 


在 串 行 计算 中 ， 一 个 处 理 器 对 存储 在 适当 数据 结构 中 的 数据 进行 操作 。 这 种 数据 变化 的 发 
生 过 程 通常 写成 算法 的 形式 。 对 并 行 计算 来 说 ， 这 种 设计 方式 必须 改变 。 在 并 行 计算 中 ， 算 法 
设计 环境 是 完全 不 同 的 。 本 章 介绍 设计 并 行 算法 的 各 种 环境 。 在 设计 串 行 算法 的 时 候 ， 如 果 时 
间 复 杂 度 为 O(n)， 那 么 我 们 就 认为 这 是 一 个 好 的 算法 。 但 在 设计 并 行 算法 的 时 候 ， 如 果 时 间 复 
杂 度 为 O(n)， 那 就 不 能 认为 是 一 个 好 的 算法 。 时 间 复 杂 度 为 O(log n), 其 中 为 足够 小 的 正 整数 ， 
且 用 多 项 式 数 目的 处 理 器 的 并 行 算法 ， 就 可 以 认为 是 好 的 算法 。 这 些 算法 属于 NC 类 。 为 了 设 
计 NC 类 的 并 行 算法 ， 我 们 在 本 章 介绍 特定 的 设计 环境 。 如 果 想 为 一 个 新 问题 设计 并 行 算法 ， 
就 可 以 用 本 章 介 绍 的 任何 一 个 设计 环境 来 解决 。 即 使 不 能 用 本 章 的 任何 设计 环境 来 解决 ， 我 们 
也 可 以 根据 问题 的 性 质 设计 新 的 环境 。 本 章 的 目的 仅仅 是 为 了 介绍 一 些 著名 的 设计 环境 。 
3.1 二 又 树 设 计 环 境 

二 叉 树 的 概念 已 经 在 第 2 章 中 介绍 过 。 一 个 有 n 个 叶 布 点 的 完全 二 叉 树 的 高 度 为 [log n]。 我 
们 可 以 在 并 行 算法 设计 中 利用 这 个 性 质 。 假 定 有 n 个 数据 ， 对 应 完全 二 又 树 中 的 n 个 叶 节 点 。 
我 们 可 以 并 行 地 对 它们 进行 处 理 ， 并 在 非 叶 节点 得 到 部 分 结果 。 然 后 继续 从 底部 向 上 走 ， 并 
在 [log n] 时 间 内 到 达 根 节点 。 这 些 都 会 在 本 厂 给 出 。 

n 个 数 求 和 ”下 面 我 们 来 看 a 个 数 求 和 的 问题 。 在 单个 处 理 器 上， 此 问题 需要 O(n) 的 时 间 。 
下 面 让 我 们 来 看 看 如 何 用 更 多 的 处 理 器 来 减少 计算 时 间 。 假 定 x = 2。 当 n = 8 时 ， 把 数据 分 成 
两 组 ， 即 有 

GroupI: 4() A(3) A(5) A(7) 
Group I: 4(2) 4(4) A(6) A(8) 

每 组 包含 4 个 元 素 。 因 此 ， 用 n/2 个 处 理 器 (也 就 是 4 个 处 理 器 )。 现 在 ， 相 应 的 数据 可 以 

同时 被 这 4 个 处 理 器 相 加 ， 并 分 别 存在 4(1), 4(2), 4(3) 和 4(4) 中 。 这 些 在 图 3-1 中 给 出 。 利 用 下 





A() A2) A A4 A5 Al) AT) A8) 


图 3-1 n= 8 个 数 的 求 和 
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面 给 出 的 数据 ， 我 们 在 图 3-2a 至 图 3-2d 中 演示 了 这 个 过 程 。 
4(0) 42) A(3) A(4) A(5) A(6) 407) 4(8) 
51 17 42 34 85 1 19 54 
在 第 一 阶段 ， 进 行 如 下 操作 : 
4(1) -A(1)+A(2) = 68 
A(2) ~ 4(3)+4(4) = 76 
A(3) + 4(5)+4(6) = 96 
A(4) ~ 4(7)+A4(8) = 73 
通常 ， 对 于 i = 1,…,4， 进 行 如 下 操作 : 
AD A(2i—1)+A(27) 
然后 ， 在 第 二 阶段 ， 则 进行 : 


4(D A(1)+A(2) = 144 
A(2) ~ A(3)+A(4) = 169 





Al) Al2) A) A) AS) A6) AP Ae) 





图 3-2 
a) 初始 值 b) 第 一 阶段 


77 





111 
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图 3-2 《〈 续 ) 
c) 第 二 阶段 d) 第 三 阶段 


也 就 是 ， 对 i = 1, 2 计算 : 
A(i) ~ A(2i~1)+A(22) 
在 第 三 阶段 ， 计 算 : 
4(1) 一 4(1)+4(2) = 313 
这 可 以 通过 下 面 的 并 行 算法 实现 : 
算法 SUM 
输入 : 数组 A(1:n),n = 2 
输出 : 数组 值 的 总 和 存储 于 4(b 中 
BEGIN 
1l.p=n/2 
2. Whilep>0do 
3. For i= 1 top do in parallel 
4. A(i) = A(2i-1) + A(27) 
5. End parallel 
6.p= {p/2} 
7. End while 
END 
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复杂 度 分 析 p 是 处 理 器 的 个 数 ， 开 始 的 时 候 为 n/2 个 。p 的 值 在 每 次 while 循 环 达 代 时 减 半 。 
因此 ，while 循 环 重复 log n 次 。 另 外 ， 此 算法 既 不 用 并 发 读 ， 也 不 用 并 发 写 。 这 样 ， 此 算法 可 
以 在 EREW PRAM 模 型 中 用 O(n) 个 处 理 器 ， 并 在 O(log n) 的 时 间 内 完成 。 


3.2 二 倍增 长 


这 是 一 个 很 有 趣 的 设计 方法 ， 因 为 它 只 在 设计 并 行 算法 才 用 到 。 如 果 有 n 个 数据 需要 处 理 ， 
那么 开始 的 时 候 每 个 处 理 器 覆盖 一 个 数据 ， 并 等 待 合作 。 第 一 步 时 每 个 处 理 器 中 的 数据 为 2， 
第 二 步 变 成 4， 第 三 步 为 8， 以 此 类 推 。 每 一 步 都 是 把 前 一 步 的 数据 个 数 翻 倍 。 

?个 数 的 求 和 过 程 可 以 看 成 二 倍增 长 的 例子 。 第 一 步 ， 每 个 处 理 器 求 两 个 数 的 和 : 

已 求 + Xx 
P 求 xX; + Xx 


Pn 求 Xx + x 


已 求 0 + x2) + (Xs + X) 
P, 求 (x; + Xe) + (xy + Xs) 


Pa 求 (x,， 十 Xi 2) 十 (XI + Xx,) 
这 里 的 每 一 步 中 每 个 处 理 器 所 处 理 的 数据 个 数 都 是 前 一 步 的 两 倍 。 这 就 使 得 处 理 器 可 以 在 
log mn 的 时 间 内 聊 盖 所 有 的 n 个 数据 。 下 面 给 出 的 “列表 排序 ” (ranking a list) 问题 是 另外 一 个 
这 方面 的 例子 。 


3.3 ”指针 跳 转 


很 多 典型 问题 都 大 量 使 用 链接 列表 这 种 数据 结构 。 如 果 想 从 表 头 到 达 表 尾 ， 在 串 行 的 情 
况 下 需要 O() 的 时 间 。 而 指针 跳 转 技术 却 提 供 了 一 种 可 以 在 CO(log 六 时 间 内 到 达 表 尾 的 方法 。 
我 们 在 下 面 的 例子 中 来 说 明 : 

列表 排序 问题 ”假定 A(1:n) 为 一 个 数组 。 这 些 数 以 某 种 顺序 成 为 链接 列表 。LINK(Gi) 表 示 
4(D) 下 面 一 个 数 的 下 标 。LINK(3) = 7 表示 在 链接 列表 中 A(7) 是 4(3) 的 下 面 一 个 。 如 果 A() 是 列 
表 的 最 后 一 个 数 ， 那 么 LINK(i) = 0。 变 量 HEAD 包 含 第 一 个 数 的 下 标 。 一 个 数 的 排名 定义 为 
它 和 链表 尾 的 距离 。 链 表 的 最 后 一 个 数 的 排名 为 1， 倒 数 第 二 个 的 排名 为 2， 以 此 类 推 。 链 表 
的 第 一 个 数据 排名 为 x*。 图 3-3 给 出 了 有 8 个 数 的 链表 的 例子 。 


A(3) A(7) A(1) A(4) A(2) A(6) A(8) A(5) 


/i 中 


图 3-3 8 个 数 的 链接 列表 


fo 
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表 3-1 给 出 了 图 3-3 中 链接 列表 的 数组 表示 。 我 们 对 找到 每 个 数据 的 排名 感 兴趣 。 一 个 串 行 
算法 会 从 头 到 尾 遍 历 整个 列表 ， 执 行 时 间 为 0(n)。 其 算法 如 下 : 

算法 Sequential List 

输入 : A(1:n), LINK (1:n), HEAD 

输出 : RANK (1:n) 











BEGIN 
p= HEAD 
r=n 
RANK(CD) = 
Repeat 
p=LINK(p) 
r=r-l 
RANK{(p)=r 
until LINK(p) is not equal to 0 
END 
表 3-1 数组 表示 
NEAD = 3 
i A LINK 
1 93 4 
2 192 6 
3 21 7 
4 187 2 
5 270 0 
6 201 8 
7 43 1 
8 215 5 





我 们 想 为 此 间 题 设计 一 个 并 行 算法 。 引 入 一 个 新 变量 NEXT(i)。 开 始 时 NEXT(i) = 
LINK(i)。 也 就 是 说 ，NEXT() 开 始 的 时 候 表示 其 右边 邻居 的 下 标 。 那 么 在 下 一 步 ， 会 有 : 
NEXT(i) = NEXT(NEXT(i)) 


现在 NEXT(i) 表 示 距 离 为 2 的 数据 下 标 。 相 似 地 ， 在 下 一 阶段 ，NEXT() 将 表示 距离 为 4 的 
下 标 ， 即 NEXT(D 也 是 二 倍增 长 的 。 因 此 ， 在 第 [log J 阶段 ， 我 们 可 以 到 达 最 后 的 数据 ， 并 完 
成 最 后 的 排名 。 完 整 的 并 行 算 法 如 下 : 

算法 List Ranking 

输入 : A(1:n), LINK(1:n), HEAD 

输出 : RANK(1:n) 

BEGIN 

1. Fori= 1 to n do in parallel 
RANK (=1 
NEXT (i) = LINKGQ) 
End Parallel 





2. Fork= 1 to [log n] do 
2a. For i = 1 to n do in parallel 
If NEXT (i) is not zero 
RANK (i) = RANK (7) + RANK(NEXTO)) 
NEXT ©) = NEXT (NEXT()) 
Endif 
End Parallel 
Endfor 
END 


复杂 度 分 析 ”这 里 第 1 步 中 ，O(n) 个 处 理 器 可 以 在 0O(1) 时 间 完 成 工作 。 第 2 步 重复 O(log n) [4 
次 。 第 2a 步 需要 O(n) 个 处 理 器 在 O(1) 时 间 完 成 工作 。 因 此 ， 此 并 行 算法 利用 O(n) 个 处 理 器 的 
总 体 复杂 度 为 O(log n)。 第 1 步 可 以 用 EREW PRAM 模 型 实现 ， 第 2 步 也 可 以 用 EREW PRAM 模 
型 实现 ， 因 此 所 需要 的 计算 模型 为 EREW PRAM。 . 

下 面 用 本 节 已 经 用 过 的 例子 来 演示 算法 的 工作 过 程 。 演 示 过 程 在 图 3-4a 至 3-4d 中 给 


A(3) A(7) A(1) A(4) A(2) A(6) A(8) A(5) 


HEAD LINK 


NEXT NEXT 






3 7 1 4 2 6 8 5 

H LINK 7 1 4 2 6 8 5 0 
NEXT 1 4 2 6 8 5 0 0 

RANK 2 2 2 2 2 2 2 1 


A(8) A(5) 


ED 


C) 
图 3-4 
a) 初始 阶段 b) 第 一 阶段 c) 第 二 阶段 
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A(3) A(7) A(1) A(4) A(2) A(6) A(8) 





HEAD 


LINK 7 1 4 2 6 8 5 0 
NEXT 0 0 0 0 0 0 0 0 
RANK 8 7 6 5 4 3 2 1 
d) 
图 3-4 ( 续 ) 
d) 第 一 阶段 


3.4 分 而 治 


此 方法 中 ， 一 个 问题 被 分 成 几 个 子 问题 。 先 求 出 这 些 子 问题 的 解 ， 然 后 进一步 处 理 这 些 
问题 的 解 ， 从 而 得 到 整个 问题 的 解 。 用 求 和 算法 来 演示 这 个 过 程 。 如 果 A(1:n) 是 一 个 数组 ， 我 
们 已 经 知道 如 何 利 用 O(n) 个 处 理 器 在 O(log n) 时 间 内 求 得 总 和 。 在 串 行 的 情况 下 ， 用 O(n) 的 时 
间 解 决 这 个 问题 ， 此 算法 不 是 最 优 的 。 利 用 数据 划分 ， 我 们 设计 了 并 行 算法 ， 可 以 用 (n/log nn) 
个 处 理 器 在 O(log nn) 时 间 内 完成 。 数 组 4,, A,,…, 4, 被 分 成 (n/log 六 个 组 ， 每 个 包含 log "个 数组 
元 素 。 为 了 简便 ， 我 们 假定 (n/log n) 和 log 7 是 整数 。 设 上 = log nn 且 r = n/log n。 那 么 ， 有 rk = 
n = 2:。 下 面 给 出 分 组 : 


组 1: AAsAy 4， 
组 2: AD 几 4 Ah 
组 3: 4 As AN ， 
组 i: A von A oe A 
组 r: A jog mrt A iiog nt .Aon 


在 每 一 组 ， 有 log 个 数组 元 素 ， 且 共有 r = mwlog ?个 组 。 我 们 给 每 一 组 分 配 一 个 处 理 器 ， 

因此 只 需要 (mwlog nn) 个 处 理 器 。 每 个 处 理 器 得 到 log "个 数组 元 素 。 现 在 ， 每 个 得 到 log "个 数组 
116| 元 素 的 处 理 器 P; 会 在 O(log 1) 时间 内 品行 完成 第 组 数组 元 素 的 求 和 ， 并 存 人 变量 B,。 现 在 只 有 

元 素 B1,B,,…,Bnos,。 利 用 3.1 节 中 的 算法 ， 可 以 利用 O(n/log n) 个 处 理 器 在 O(log(n/log 几 )) 时 间 内 
完成 求 和 。 已 知 O(log(n/log n)) = O(log n-loglog n) = O(log n)。 此 算法 利用 O(n/log 加 个 处 理 
器 在 Odog 站 时 间 内 完成 求 和 ， 因 此 它 是 解决 求 和 问题 的 最 优 算法 。 此 算法 正式 给 出 如 下 : 

算法 Optimal-Sum 

输入 : 数组 A(1:n) 

输出 : 数组 元 素 的 和 存 于 变量 SUM 中 
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一 


. For i = 1 to n/log n do in parallel 
2. Using the sequential method find the sum of A 00 ni, Aionognay "Aiiogn and store the result 


jn variable B, 


ww 


. End parallel 

4. Find the sum of B,, B,,……B n/log n and store in the variable SUM 

5. End optimal sum 

复杂 度 分 析 “上面 的 算法 中 ， 第 2 步 利 用 串 行 算法 在 CO(log n) 时 间 内 完成 。 所 以 ， 第 1-3 步 
可 以 用 O(n/log nn) 个 处 理 器 在 O(log 六 时 间 内 完成 。 第 4 步 可 以 用 第 3.1 节 的 并 行 算 法 在 
O(log(n/log 六) 时 间 内 在 EREW PRAM 模 型 下 完成 。 因 此 ， 上 述 算 法 在 EREW PRAM 模 型 下 利 
用 O(n/log nn) 个 处 理 器 在 O(log 刀 时 间 内 完成 。 该 算法 是 最 优 的 。 刚 才 解 释 的 分 而 治之 算法 也 
可 以 用 来 求 数组 4(1:n) 中 的 最 小 /最 大 值 。 和 上 面 给 出 的 算法 非常 相似 ， 可 以 在 EREW PRAM 
模型 下 利用 O(n/log nn) 个 处 理 器 在 O(log 六 时 间 内 解决 这 个 问题 。 


3.5 划分 


在 分 而 治之 方法 里 面 ， 我 们 把 问题 分 成 子 问 题 ， 然 后 并 发 求解 子 问题 ， 最 后 合并 这 些 子 
问题 的 结果 得 到 最 后 的 结果 。 也 就 是 ， 分 而 治之 包含 如 下 几 步 : 

第 一 步 : 把 问题 分 成 子 问题 P,P;,,…,P,， 并 发 求解 ， 得 到 解 $1,5,…,S,。 

第 二 步 : 合并 这 些 子 问题 的 结果 得 到 最 后 的 结果 。 

在 划分 技术 中 ， 我 们 更 多 关注 把 问题 分 成 子 问题 的 过 程 。 仔 细 地 把 问题 分 成 子 问 题 P,P,， 
…,P,， 使 得 求解 这 些 子 问 题 的 同时 ， 原 问题 的 解 已 经 得 到 。 换 句 话 说 ， 划 分 子 问题 的 方法 使 
得 分 而 治之 的 第 二 步 是 不 必要 的 。 这 可 以 通过 合并 的 例子 来 说 明 。 

合并 问题 ” 设 4(1:n) 和 B8(1:n) 是 两 个 排 过 序 的 数组 ， 也 就 是 A1< A,< … < 4, 且 B,< B,<… 
< B,。 我 们 想 把 这 两 个 数组 合并 成 一 个 数组 C(1:2n)， 使 得 C,& Cg … < Css。 如 果 A = 
(1,5,9,12) 且 B = (2,3,15,19)， 合 并 这 两 个 数组 可 得 到 C = (1,2,3,5,9,12,15,19)。 为 了 方便 ， 设 n 
= 2: 和 n/log n = +r， 且 进 一 步 假设 k 和 r 都 是 整数 。 我 们 知道 下 面 的 串 行 算法 可 以 在 O(n) 的 时 间 
内 合并 两 个 数组 。 

算法 Sequential Merge 

输入 : 两 个 有 序数 组 A4(1:n) 和 B(1:n) 

输出 : C(1:2n), 且 LC,< Cg <, 


1. Let 4 =B,,=% 
2.i=1;j=1;k=]1 
3. While k« 2n do 
4. If A, < B,, then 
C= A, 
[= 二] 
else 
c=B, 


j=j+l 


| 
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end if 
$5.k= k+l 
6. end while 


7. End sequential merge 


方法 是 把 排序 数组 4 分 成 r =n/log n 个 组 ， 每 组 有 k = log 个 元 素 ， 如 下 : 


组 1: 4 44 A 
组 2: AAroAi A 
组 i; AyenAo pe A 
组 r: A pA pe A 


现在 我 们 要 找到 r 个 整数 j(1),j(2),…,j(r)， 使 得 
j(1) 是 最 大 的 下 标 ，A > Bi 
j(2) 是 最 大 的 下 标 ， A 2 Bio, 


j( 站 是 最 大 的 下 标 ，Ah, 2 Bi 
这 样 就 把 数组 8(1:n) 分 成 r 个 组 ， 如 下 : 


组 1: 万 ,再 Bi 
组 2: BowsBro Bo, 
组 i: Bi ppBi ae Bi 
组 r: Bi ypBie pa Bi, 


现在 我 们 可 以 有 如 下 结论 : 4 数组 的 第 1 组 的 每 个 成 员 都 小 于 或 等 于 B 数 组 的 第 2.3… 组 的 
每 个 成 员 。 如 果 4 数 组 的 第 1 组 和 8 数组 的 第 1 组 单独 合并 ， 可 以 确保 数组 元 素 已 经 到 达 最 后 得 
到 的 排序 数组 C(1:n) 中 的 最 后 位 置 。 这 些 对 其 他 分 组 也 成 立 。 因 此 ， 我 们 把 处 理 器 i(1 < i < 7) 
分 配给 4 数组 的 第 i 组 和 8B 数组 的 第 组， 处 理 器 i 串 行 合 并 A 数组 的 第 组 和 B 数 组 的 第 i 组。 

现在 正式 给 出 这 一 并 行 算 法 : 

算法 Merge 

输入 : 两 个 有 序数 组 4(1:n) 和 B(1:n)， 设 n = 24 log n = 
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输出; 合并 的 数组 C(1:2n) 

1, for i= 1 tordo in parallel 

2. Using binary search find the index 

J(i) = Max {1, such that A,. 2 B,} 
3. Using sequential method merge the two arrays 
A((i—- Dk+ 1 :ik)and BGG-1) + 1 :ID) 

4. End parallel 

5. end Merge 

为 了 演示 上 面 的 算法 ， 考 虑 数组 4 = (1,5,15,18,19,21,23,24,27,29,30,31,32,37,42,49) 和 B = 
(2,3,4,13,15,19,20,22,28,29,38,41,42,43,48,49)。 这 里 n= 16 =2:，log n=k=4, r=n/logn=4. 
把 4 分 成 4 个 组 (r = 4)。 


j(i) 的 值 分 别 是 i1) = 5,j(2) = 8, 13) = 10 和 j(4) = 15。 把 8 数组 的 分 组 情况 附 在 上 表 之 后 一 并 给 
出 如 下 : 














| 第 组 | 
1, 5, 15, 18 | 19, 21, 23, 24|27, 29, 30, 31 32, 37, 42, 49 
| a | 2, 3, 4, 13, 15 28, 29 38, 41, 42, 43, 48, 和 9 


当 我 们 按 组 合并 数组 4 和 有 8 的 子 数组 时 ， 有 : 
分 组 1 得 到 : C(1:9) = (1,2,3,4,5,13,15,15,18) 
分 组 2 得 到 : C(10:16) = (19,19,20,21,22,23,24) 
分 组 3 得 到 : C(17:22) = (27,28,29,29,30,31) 
分 组 4 得 到 : C(23:32) = (32,37,38,41,42,42,43,48,49,49) 
因此 ， 得 到 最 后 的 数组 : 
C(1:32) = (1,2,3,4,5,13,15,15,18,19,19,20,21,22,23,24,27,28,29,29,30,31,32,37,38,41,42,42, 
43,48,49,49) 
复杂 度 分 析 第 2 步 可 以 用 二 分 搜索 在 O(log n) 时 间 内 完成 。 第 3 步 需要 的 时 间 取 决 于 数组 
A 和 和 B 的 子 数 组 。A((i-Dk+1:iD) 的 大 小 为 6 BGG-1)+1:j(i)) 的 大 小 未 知 。 如 果 其 大 小 也 是 小 于 
或 等 于 k， 那 么 算法 的 第 3 步 可 以 在 处 理 器 i 上 用 O(log nn) 时 间 串 行 完 成 。 如 果 BO(i-1)+1:j(i)) 的 
大 小 大 于 k， 我 们 必须 先 对 数组 8 递归 重复 相同 的 划分 技术 ， 然 后 是 4。 因此， 第 3 步 可 以 在 处 
理 器 i 上 用 Ollog 站 时 间 串 行 完 成 。 这 样 ， 此 算法 可 以 在 EREW PRAM 模 型 上 用 O(n/log 怠 个 处 
理 器 在 O(log n) 时 间 内 完成 。 


3 3 3 1 3 » 3 a 3 » 
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3.6 小 结 


本 章 中 介绍 了 一 些 重要 的 设计 环境 。 为 了 演示 这 些 设 计 环 境 ， 我 们 设计 了 一 些 简单 的 并 
行 算法 。 二 又 树 设计 环境 借用 了 二 叉 树 的 数据 结构 。 数 据 进行 适当 的 分 布 和 处 理 可 以 获得 高 
效 的 并 行 算法 。 另 外 一 个 指针 跳 转 的 设计 环境 在 第 3.2 节 中 给 出 ， 并 用 适当 的 例子 进行 了 完整 
的 解释 。 我 们 还 用 简单 有 趣 的 例子 对 分 而 治之 和 划分 技术 进行 了 解释 。 
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习题 

3.1 给 定 二 维 平面 上 n 个 点 的 集合 5 = {pi,p2.p3…, Pp,}，5 的 平面 山 包 是 能 够 包含 这 a 个 点 的 
最 小 的 凸 多 边 形 。 请 设计 一 个 分 而 治之 的 并 行 算法 来 求 把 x 个 点 连接 起 来 得 到 凸 包 边 
界 的 序列 。 

3.2 考虑 下 面 给 出 的 求 部 分 和 的 递归 方法 : 
1 给 定数 组 zs 
2. 求 好 2,… mn 的 部 分 和 ， 并 记 作 zi,z2,… zn。 其 中 z = XtXt* +X, Hi n/2+l; 
3. 对 于 i < n/2, 5 = 2; 
4. 对 于 i > n/2，s; = z+ 2,/2。 


利用 上 面 的 技术 ， 设 计 一 个 非 递归 算法 求 数组 的 部 分 和 。 
3.3 设 4 为 一 个 nx n 的 下 三 角 和 矩阵 ， 且 nn 是 2 的 器 次 方 。 假 定 4 是 非 奇 异 的 。 把 4 分 成 如 下 


四 块 : 
4 | 
4 4 
在 上 面 的 矩阵 中 ，45,,4: 和 42: 都 是 (W2 x mw2) 的 矩阵 。 那 么 整个 矩阵 的 逆 如 下 : 
4 -| 入 | 
-A; hh 42 


利用 上 面 的 方法 ， 设 计 一 个 分 而 治之 的 算法 求 下 三 角 托 阵 的 逆 。 
3.4 A 是 一 个 大 小 为 n 的 布尔 数组 。 我们 要 求 最 小 的 下 标 i:， 且 A(i) 为 真 。 
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a) 设计 一 个 CREW PRAM 模 型 下 的 并 行 算法 ; 
b) 设计 一 个 CRCW PRAM 模 型 下 的 并 行 算法 。 

3.5 设 X(1:n) 为 大 小 为 n 的 数组 。 数 组 元 素 x; 的 左 匹配 是 指数 组 元 素 x (如 果 存 在 )， 其 中 k 
是 最 大 的 下 标 ， 且 1 < k<i，% < x;。 相 似 地 ， 可 以 定义 数组 元 素 x; 的 右 匹 配 。 请 设计 
一 个 并 行 算法 求 数组 每 个 元 素 的 左右 匹配 。 

3.6 请 用 划分 技术 设计 一 个 算法 求 数组 4(1:n) 的 最 小 元 素 ， 并 验证 用 O(n/log nn) 个 处 理 器 
的 时 间 复 杂 度 为 O(log n)。 

3.7 对 于 n = 16， 画 出 在 习题 3.6 中 所 设计 的 算法 的 二 又 树 表示 。 
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第 4 章 简单 并 行 算 法 
本 章 我 们 研究 一 些 简单 的 问题 ， 并 演示 怎样 设计 并 行 算法 来 解决 这 些 问题 。 


4.1 向 量 内 积 


设 a = (ai, qs,… ,aw) 和 65 = (b1, b;…, b,) 是 两 个 向 量 ， 那 么 这 两 个 向 量 的 内 积 为 a: b = aibi+ 
qzb;+…+ 4awb,、 我 们 关注 的 是 设计 能 够 求 出 两 个 向 量 的 内 积 的 并 行 算法 。 这 与 求 数组 元 素 的 和 
的 算法 类 似 。 两 个 数组 a[1:n] 和 b[1:n] 都 存在 共享 内 存 里 。a. b 最 后 的 结果 存在 另外 一 个 变量 
cl 中。 

下 面 的 算法 描述 了 这 种 方法 : 

算法 Scalar Product 

输入 : 数组 af1:n] 和 b[1:n] 

输出 : 内 积 的 值 存 于 变量 c 中 

BEGIN 

1. Fori= 1 ton do in parallel 
2.ci = ai*b, 
3. End parallel 
4.p=n/2 
5.Whilep>0do 
6. For i= 1 to p do in parallel 
7.ci= CitCip 
8. End parallel 
9.p = [p/2] 

10. End while 

END 


在 此 算法 中 ， 第 1 ~ 3 步 需 O(m) 个 处 理 器 ， 并 在 O(1) 时 间 内 完成 。 第 4 ~ 10 步 就 是 数组 的 求 
和 过 程 。 因 此 ， 该 算法 可 以 在 EREW PRAM 模 型 上 用 O(n) 个 处 理 器 在 O(log ) 时 间 内 完成 。 结 
果 将 存在 变量 c, 中 。 利 用 第 3 章 3.4 节 介绍 的 分 而 治之 技术 ， 此 问题 可 以 利用 O(n/log 罗 个 处 理 
器 在 O(log nm) 时 间 内 完成 。 这 个 问题 作为 习题 留 给 读者 。 在 下 一 节 ， 我 们 演示 一 个 更 为 流行 的 
矩阵 乘法 并 行 算法 的 设计 过 程 。 


4.2 ”矩阵 乘法 


和 矩阵 乘法 在 一 些 重要 的 问题 中 扮演 着 很 重要 的 角色 。 如 果 A 是 m x nm 的 矩阵 ，B 是 xp 的 矩 
阵 ， 那 么 可 以 计算 它们 的 乘积 C = 4B， 且 其 阶 为 m x p。 和 矩阵 C 的 第 ; 行 和 第 j 列 的 元 素 为 C(i, 旋 ， 
它 通过 和 盾 阵 4 的 第 i 行 和 和 矩阵 8 的 第 / 列 的 内 积 得 到 。 即 : 
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(bu\ 
b,, 
CC 三 (di ,liz | “ | 


b, 


可 
CD) = Danb, 


算法 如 下 所 示 : 
算法 Matrix-Multiply 
输入 : 矩阵 4 和 B 
输出 : 乘积 矩阵 C 
BEGIN 
1. For i= 1 to m do in parallel 
2. Forj= 1 top do in parallel 
3. Evaluate C(i)) 
4. End Parallel 
5. End Parallel 
END 
这 里 对 第 3 步 必须 进 行进 一 步 的 解释 。C(i, 旋 的 计算 是 两 个 向 量 的 内 积 ， 它 由 下 面 的 语句 
段 来 完成 。 每 个 处 理 器 都 用 一 个 本 地 临时 变量 T(1:n) 保 存 A(i, D*B(K, 旋 的 值 。 
3.1 Fork=1 ton doin Parallel 


3.2 T(K) = ACGi KR)*B(K) 

3.3 End parallel 

3.4 p=n/2 

3.5 Whilep > 0 do 

3.6 For k= 1 top do in Parallel 
3.7 TO) = T(Q2K-1) + TC 
3.8 End Parallel 

3.9 p= [p/2] 


3.10 End while 

3.11 C(iy) = T(1) 

复杂 度 分 析 上 面 的 语句 段 包 含 两 个 部 分 。 在 第 一 部 分 先 对 A(i, )*B(k, 四 进行 计算 ， 然后 
在 第 二 部 分 把 这 些 值 相 加 得 到 C(i, 站 的 值 。 本 地 临时 变量 T(1:n) 被 用 来 保存 相 乘 和 相 加 的 结果 。 
在 这 一 部 分 ， 第 3.1 ~ 3.3 步 需 用 O(n) 个 处 理 器 ， 需 要 O(1) 的 时 间 。 第 3.4 ~ 3.11 步 和 SUM 算 法 相 
同 ， 因 此 需 用 O(m) 个 处 理 器 ， 需 要 O(log nn) 的 时 间 。 第 3 步 被 放 在 两 层 嵌 套 的 并 行 循环 里 面 ， 
因此 用 O(mnp) 个 处 理 器 该 算法 的 时 间 复 杂 度 为 O(log n)。 特 别 是 ， 当 4 和 8B 为 方 阵 时 ， 用 O(n ) 
个 处 理 器 算法 的 时 间 复杂 度 为 O(log n)。 在 计算 CGi, 1), C(i, 2),…,C(i, ) 时 需要 A(i, 力 。 由 于 不 
同 组 的 处 理 器 并 发 计算 CGi, 1), C(i, 2)…,C(i, n)， 因 此 多 个 处 理 器 会 同时 读 取 ACi, 族 。 所 以 上 述 
算法 需要 CREW PRAM 模 型 。 如 果 采 用 第 3 章 3.4 节 的 分 而 治之 技术 ， 可 以 利用 OUzlog 双 个 处 
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理 器 在 O(log n) 的 时 间 内 完成 。 下 面 一 节 给 出 的 例子 将 解决 一 个 更 有 趣 的 问题 。 
4.3 部 分 和 
设 A(1:n) 为 个 数 的 数组 。 此 数组 的 部 分 和 定义 为 : 
PS) -SAD (1<ign) 


我 们 用 二 又 树 设计 环境 来 计算 部 分 和 PS(i)(1 < i<n)。 利 用 此 算法 求 数组 的 和 ， 只 能 得 
到 PS(n)。 我 们 需要 修改 此 算法 得 到 部 分 和 。 图 4-1 演 示 了 对 n = 8 的 求 和 算法 。5(i, 四 表示 从 
左 到 右 数 第 h-i 层 的 第 j 个 节点 。 开 始 ， 设 定 5(0, i) = 4(D); 然后 ， 通 过 增加 子 节点 得 到 S(1， 
让 。 在 第 一 个 时 间 片 ， 得 到 5(1,1), S(1,2), S$(1,3) 和 5(1,4)。 在 第 二 个 时 间 片 ， 我 们 得 到 5S(2,1) 
和 5(2,2)。 在 第 三 个 时 间 片 ， 我 们 得 到 5S(3,1)。 整 个 过 程 从 下 向 上 在 O(log n) 时 间 内 完成 ， 其 
中 n 是 数组 的 长 度 。5 值 的 求解 过 程 在 图 4-2a 至 图 4-2d 中 演示 。 现 在 ，S(3,1) 是 整个 数组 的 元 
素 的 和 。 





AT AlQ) AG AN AS A6 AD AB) 


图 4-1 树 中 的 SG, 放 值 
5(2,1) 是 前 四 个 元 素 的 和 。 为 了 得 到 部 分 和 ， 我 们 引入 另 一 个 变量 PS。 最 后 的 部 分 和 将 是 
PS(0,1), PS(0,2),…,PS(0,n)。 这 些 结果 可 以 通过 遍历 二 又 树 从 根 到 叶 的 季 点 得 到 。 从 5 的 值得 
到 PS 值 的 过 程 如 下 : 
从 PS(3,1) = 5(3,1) 开 始 ， 得 到 下 一 层 : 


SU, 让， j=1 
PS(i,j)= 41PS(it1[j/2])+ Si 站)，j 为 奇数 且 j>1 
PSG+1 j/2), .为 偶数 


我 们 用 有 8 个 元 素 的 数组 演示 此 过 程 如 下 : 


一 TD 
EECIEIEIEIEIEIEIE 
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S(0,1) S(0,2) S(0,3) S(0,4) S(0,5) S(0,6) S(0,7) S(0,8) 
c) 
图 4-2 
a) 初始 阶段 b) 第 一 阶段 0) 第 二 阶段 
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23 38 40 73 91 39 
d) 
图 4-2( 续 ) 
d) 第 二 阶段 


SG 的 值 可 以 通过 从 下 至 上 遍历 二 叉 树 得 到 。 这 在 图 4-2d 中 给 出 。 在 计算 出 SG) 之 后 ， 
根据 上 面 的 公式 通过 从 上 至 下 遍历 二 叉 树 得 到 PS(4, 刀 。 这 在 图 4-3a 到 图 4-3d 中 给 出 。$ 的 值 在 
每 个 节点 的 外 部 给 出 ，PS 的 值 在 每 个 节点 的 内 部 给 出 。 在 SG4, 站 的 计算 过 程 中 ， 很 容易 发 现 可 
以 并 行 计 算 PS(i,1), PS(i,2),…。 另 外 ， 可 以 发 现 PSGi, 站 被 并 发 地 用 在 计算 PS(Gi-1,27) 和 PS(i~1， 
2j+1) 的 过 程 中 。 因 此 需要 CREW PRAM 模 型 。 算 法 如 下 : 

算法 Partial-Sum 

输入 : 数组 4(1:n) 

输出 : 部 分 和 PS(0, 1:n) 

BEGIN (i denotes level number and p the number of nodes at that level.) 

0. Copy 4(D to $(0, i) for 1 < i n in parallel 
l.p=n 
2. Fori= | to [log nl] do 
3. p= [{p/2] 
Forj= 1 top do in parallel 
S$S(ij) = $(1—2, 2)) + S$(i—1, 27-—1) 
End Parallel 
. End for 
8. PS([log n], 1) = S({log 1], 1) 
9.h=1 
10. For i = [jog 中-1 down to 0 do 
ll. p=2p 
12, For j= 1 top do in parallel 
13, Case 
j= 1: PS(iy) = SG 
j= even: PS(iy) = PS(i+ 1,7/2) 


-OO mn 上 
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Else: PS(iy) = PSG + 1, [12D) + SCiy) 


Endcase 
14. End parallel 
15. End for 
END 
复杂 度 分 析 利用 O(n) 个 处 理 器 ， 


第 0 步 需 要 O(1) 时 间 ; 利用 O(n) 个 处 理 器 ， 第 2 到 第 7 步 


需要 O(log 站 时 间 ; 利用 O(n) 个 处 理 器 ， 第 10 步 到 第 15 步 也 需要 O(log nn) 时 间 。 因 此 ， 利 用 
O(n) 个 处 理 器 ， 该 算法 的 复杂 度 为 O(log n)。 从 PS(ij) 的 公式 可 以 看 出 ，PS(iy) 被 并 行 应 用 于 
PS(i-1, 2j~1) 和 PS(i-1, 27) 的 计算 过 程 中 。 因 此 需要 并 发 读 模型 ， 但 是 整个 程序 不 需要 并 发 写 ， 


可 以 用 CREW PRAM 模 型 实现 该 算法 。 





图 4-3 
a) 第 一 阶段 b) 第 二 阶段 
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d) 


图 4-3 ( 续 ) 
c) 第 三 阶段 d) 最 后 结果 


4.4 二 项 式 系数 


二 项 式 系数 ("由 如 下 公式 给 出 : 


上 ta 
r) tn- 站 
现在 要 求 出 所 有 的 二 项 式 系 数 : 





蓝 了 4 全 曾 形 六 麻 茸 洁 95 


我 们 可 以 把 一 项 式 系数 写成 三 角 表 的 形式 。 为 了 简便 ， 用 C。 表示 WE 
Coo 
Cio Cu 


也 可 以 用 方形 表 的 形式 表示 : 
Coo Cn (人 2 C3 Ca Css 


Cs oe a 
如 果 此 二 维 数组 用 P 表 示 ， 那 么 有 P= (ij)= Cs i>1, j>0。 


-1 fn-l 
自 ( (+( :我 们 得 到 PG = PG-1D + PC-17-D。 在 PC-1 上 重复 利用 这 


一 结果 ， 得 : 
P(i,)= 它 Pl(k,j—1) 
我 们 得 到 如 下 表 的 P 值 : 
Co Cu C2 Cs Cu Css 
Co Ci Cs Cs Cs 
Ca Ca Cu Cs 
Cy Ca Cs 
Cn Cs 
Ca 


一 1 
(ij) 处 的 值 通过 累加 前 一 列 直 到 第 ; 行 位 置 的 值得 到 。 注 意 P(i,0) = Ce = ( ) =1， 同 时 


P(U = C= 1。 也 就 是 说 ， 第 一 行 和 第 一 列 的 所 有 位 置 的 值 都 为 1。 整 个 过 程 先 对 第 一 列 所 有 
的 位 置 写 人 1， 然 后 求 出 第 一 列 的 部 分 和 并 对 下 一 列 重复 上 述 过 程 。 

算法 Binomial-Coeff 

输入 : 正 整数 n 


输出 :二 项 式 系数 [0] 中)…( 


BEGIN 
1.Fori=]1 ton+! do in Parallel 
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2.P(i,0)=!1 

3. End parallel 

4. Forj=1tondo 

5. Find the partial sums of the ( 广 1)th column entries using PARTIAL SUM algorithm and 


store in jth column. That is, 
P(i,)) = Pi- 1) where i= 1 ton-j+tl 


6. End for 
7. OUTPUT the result as Pn+1,0), Pn,1), Pn—1, 2),** 
END 
复杂 度 分 析 第 1 ~ 3 步 可 以 用 O(n) 个 处 理 器 在 O(1) 内 完成 。 用 O(n) 个 处 理 器 ， 第 5 步 可 以 
在 O(log n) 时 间 内 完成 。 由 于 采用 了 部 分 和 算法 ，CREW PRAM 模 型 可 以 实现 该 算法 。 现 在 我 
们 来 看 该 算法 如 何 工 作 。 假 定 ” = 6 是 给 定 的 输入 ， 那 么 P 表 可 以 在 6 次 迭代 中 形成 。 初 始 值 在 
表 4-1 中 给 出 。 
表 4-1 初始 值 


日 
Os 
四 
日 
CN 


I |- 


在 第 1 次 选 代 中 ， 第 一 列 的 值 通过 部 分 求 和 形成 ， 如 表 4-2 所 示 。 之 后 的 迭代 在 表 4-3 到 表 
6 6 6 6 6 6 
4-7 中 给 出 。 在 表 4-7 中 ， 左下 到 右上 的 对 角 位 置 给 出 了 [0 、 (小 (中 中 (2): 四 


和 [6 的 人 分 别 为 1、 6、15、20、15、6 和 1。 
表 4-2 第 一 阶段 的 值 


| :| :|;，|+|;: | 

i 
一 
3 1 3 

CE EE I EE 
i 
EC EE EE 
”1 | | | 1 
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表 4-7 最 后 的 值 


一 个 
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J 
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4.5 范围 内 最 小 值 问题 


设 A(1:n) 为 x 个 数 的 数组 。 在 EREW PRAM 模 型 中 ， 用 O(m) 个 处 理 器 可 以 在 O(log 站 时 间 内 
确定 数组 元 素 的 最 小 值 。 同 样 的 问题 也 可 以 在 CRCW PRAM 模 型 中 用 O(n”) 个 处 理 器 在 O(1) 时 
间 内 完成 (参见 第 3 章 )。 范 围 内 最 小 值 问题 也 可 以 表述 如 下 : 给 定 任意 ifhj, 且 1 <i < j<n， 
求 出 4., 4 … 包 中 最 小 的 元 素 。 

当 i = 1 和 1 = n 时 ， 苑 围 内 最 小 值 问题 化 简 为 数组 求 最 小 值 的 简单 问题 。 预 先 对 数组 进行 
处 理 并 存储 成 适当 的 形式 ,这样 可 以 高 效 地 处 理 范 围 内 最 小 值 的 问题 。 考 虚数 组 A = 
(8,3,4,522,11,15,17,19,7,16,5,9,10,2,8)， 一 些 范围 内 的 最 小 值 在 表 4-8 中 给 出 。 


表 4-8 一 些 范围 最 小 值 


范围 
i j 元 素 最 小 值 
3 8 4,5,2,11,15.17 2 
9 12 19,7,16,5 5 
5 11 2,11,15,17,19,7,16 2 


为 了 继续 进行 求解 ， 我 们 定义 两 个 术语 ， 数 组 的 前 级 最 小 (prefix minima) 和 后 级 最 小 
(suffix minima)。 对 于 数组 ai,a;,…,a,， 基 前 级 最 小 为 数组 P = (pi,p;…,p,)， 其 中 p; = min {qa;， 
…,Q}。 即 p, 是 数组 前 ;个 元 素 中 的 最 小 值 。 相 似 地 ， 后 级 最 小 定义 为 一 个 序列 $ = ($1,82,… ,5)， 
其 中 s, 是 数组 最 后 i 个 元 素 中 的 最 小 值 。 

即 : 

S = min{a,} 
$2 = min{a, ,a,} 
$3 = Min{4,_2,4n_1,0n} 


$; = min{a i dn} 
如 果 原 来 的 数组 为 4 = (8.3,4.5.2,11) ， 那 么 其 前 组 最 小 和 后 组 最 小 分 别 为 P = (8,3,3,3,2,2) 
和 S$ = (11,2,2,2,2,2)。 对 于 有 n 个 元 素 的 数组 4 (假定 上 = 2)， 为 了 解决 范围 内 最 小 值 问题 ， 我 
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节点 用 (1,1), (12), (1,3),…, (1, n/2) 表 示 ; 再 下 一 层 的 节点 用 (2,1), (2,2)…, (2,n/4) 表 示 。 所 有 
节点 都 进行 标记 。 这 在 图 4-4 中 给 出 。 





(01) (02) (03) (04) (05) (06) (07) (08) 
图 4-4 节点 作 标 记 的 完全 二 又 树 


叶 布 点 包含 给 定 的 数组 A(1:n)。 也 就 是 说 ， 标 记 为 (0 的 节点 含有 4; 的 值 。 我 们 在 图 4-5 中 
给 出 了 有 8 个 元 素 的 数组 4 = (8,3,4,5,2,11,15,17) 对 应 的 完全 二 叉 树 。 





每 个 内 部 节点 v 都 包含 有 以 "为 根 的 子 树 的 叶 的 前 缀 最 小 和 后 缀 最 小 。 例 如 ， 对 于 内 部 节 
点 (2.2)， 以 (2.2) 为 根 节点 的 子 树 的 时节 点 为 (4:,4.4,4) = (2,11,15,17)。 这 一 子 树 的 前 组 
最 小 和 后 级 最 小 分 别 为 P = (2,2,2,2) 和 5S = (17,15,11,2)。 因 此 内 部 节点 (2,2) 包含 两 个 数组 : 
P = (2,2,2,2) 和 S = (17,15,11,2)。 其 他 节点 的 内 容 在 图 4-6 中 给 出 。 怎 样 确定 P 和 5 呢 ? 现 在 让 我 
们 来 看 如 何 求 出 每 个 节点 (4 的 P 和 5 数组 。 这 要 用 从 下 至 上 的 方式 来 完成 。 对 第 一 层 的 所 有 
节点 ，P 和 S$ 各 有 两 个 元 素 。 如 果 (1 四 是 第 一 层 的 节点 ， 它 的 左 孩 子 为 (0,2i-1)， 右 孩子 为 (0,22)， 
它们 分 别 包含 4, 和 A2。 


| 













~ P=8,3,3,3,2,2,2,2, 
S = 17,15,11,2,2,2,2,2, 





图 4-6 P 和 5 数组 


设 x = min{4 -44， 那 么 内 部 节点 (0 六 所 对 应 的 P 和 43 如下: 
Po;= Ai 
9oi = A, x 
当 高 度 大 于 1 的 时 候 ， 节 点 (hj) 的 左 孩 子 为 (4-1,2i-1)， 右 孩子 为 (4-1,2i)。 确 定 Pi; 的 过 程 
如 下 : 
1. 通过 连接 两 个 列表 已 -> 和 已- ， 得 到 Pa 
2. P,., 后 半 部 分 的 每 个 元 素 x 都 被 x 和 已 ,前 半 部 分 的 最 后 一 个 元 素 中 的 最 小 值 替代 。 
此 过 程 可 以 用 下 面 的 具体 例子 来 演示 : 


例 1 
考虑 两 组 值 : 
P12 = (7,7,4,4,4,3,3,3) 
P12 = (10,8,8,8,8,8,6,6) 
第 一 步 ， 把 两 个 数组 连接 得 到 Pi: 
Ps,; = (7,7,4,4,4,3,3,3 10,8,8,8,8,8,6,6) 


现在 ， 要 用 x 和 已, 前 半 部 分 的 最 后 一 个 元 素 中 的 最 小 值 替代 x。 在 这 里 ， 前 半 部 分 的 最 后 一 个 
元 素 是 3。 因 此 ， 第 9 个 元 素 10 将 被 min{10,3} 也 就 是 3 替代 。 相 似 地 ， 第 10 个 元 素 8 将 被 3 替代 。 
最 后 ， 得 到 已 , = (7,7,4,4,4,3,3,3 3,3,3,3,3,3,3,3)。 
例 2 


假定 
已 -ai 二 (7,7,4,4,4,3,3,3) 


P12 = (10,8,8,8,2,2,1,1) 
在 这 种 情况 下 ,我 们 首先 把 两 个 数组 连接 ， 得 到 
P,, = (7.7.44,43.3,3 10,8,8,8,2,2,1,1) 
现在 ， 用 x 和 P;; 前 半 部 分 的 最 后 一 个 元 素 中 的 最 小 值 百代 x， 得 到 : 
Pu= (774443.33 3,3,3,3,2,2,1,1) 
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求 数 组 5 的 方法 也 相似 。 对 第 一 层 的 节点 (1,i)， 数 组 5 为 51, = (42jx)， 其 中 x = Min{4 Ay}。 
然后 ， 对 于 高 度 h > 1 的 节点 ， 首 先 连接 $2 和 Siss。 注 意 ，Siz 是 5;; 的 前 半 部 分 ，Siiz 是 5 
的 后 半 部 分 。 用 x 和 P;; 前 半 部 分 的 最 后 一 个 元 素 中 的 最 小 值 替代 x。 

当 所 有 节点 (4 的 前 组 和 后 级 数组 P 和 5 都 已 知 的 时 候 ， 范 围 内 最 小 值 问题 可 以 在 0(1) 时 
间 内 解决 如 下 : 设 i 和 j 为 两 个 整数 ， 且 1<i < j<n。 在 完全 二 又 树 中 找到 节点 (0,i) 和 (0 的 最 
低 公 共 祖 先 布 点 (h,k)。 由 于 这 个 树 是 完全 的 ， 这 可 以 在 O(1) 时 间 内 完成 。 我 们 确定 数组 
Ss-ize-t 和 Psiz 中 的 元 素 4i,4i4,4;:…,4 的 最 小 值 m。 

假定 x 为 数组 $2 中 市 点 (0 加 对 应 的 元 素 ，y 为 数组 Psi 中 节点 (0) 对 应 的 元 素 。Min(x,y) 
是 元 素 4,,4i.1,4io，… Ah 的 最 小 值 。 如 果 每 个 节点 的 P 和 5 已 知 ， 那 么 可 以 在 0O(1) 时 间 内 完成 范围 
内 最 小 值 问题 。 例 如 ， 考 虑 图 4-5 中 给 出 的 数 ， 假 定 i = 3 和 j = 7， 那 么 这 两 个 节点 的 最 低 公共 
祖先 节点 为 根 节点 。 所 以 ， 我 们 必须 考虑 其 左 子 节 点 的 数组 S 和 右 子 节点 的 数组 P。 它 们 是 : 

S=5,4,3,3 

P= 2,2,2.2 
数组 S$ 中 对 应 的 是 第 3 个 元 素 ， 其 值 为 3;， 而 数组 P 中 对 应 j = 7 的 也 是 第 3 个 元 素 ， 其 值 为 2。 因 
此 min{3.2} 的 解 为 2。 

复杂 度 分 析 ”给 定数 组 4(1:n)， 利 用 O(n log 个 处 理 器 ， 我 们 可 以 在 O(log nn) 的 时 间 内 完 
成 求 二 叉 树 和 每 个 节点 的 S| 和 P 值 的 问题 。 当 完成 前 期 处 理工 作 之 后 ， 对 应 任意 i 和 (1 <i < j< 
n) 的 范围 内 最 小 值 查询 问题 可 以 在 O(1) 时 间 内 完成 。 

范围 内 最 小 值 问 题 有 很 多 应 用 领域 。 它 可 以 应 用 于 树 的 最 低 公 共 祖 先 节 点 的 问题 中 《 见 
第 5 章 )。 
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习题 

4.1 设 A(0:n-1) 为 一 个 排序 的 数组 。 给 定 下 标 i，4(i) 的 左 匹配 是 最 大 的 整数 :， 其 中 0 < < 
i 且 A(k) < A(i)。 请 设计 一 个 算法 ， 利 用 O(n 个 处 理 器 在 O(1) 时 间 内 求 每 一 个 数组 元 
素 的 左 匹配 。 

4.2 设 A(0:n 一 1) 为 一 个 整数 数组 。 请 设计 一 个 算法 找到 最 小 的 下 标 t， 其 中 4() 是 正 数 ， 
且 算 法 的 时 间 复 杂 度 为 O(log n)。 再 设计 一 个 能 在 0(1) 时 间 内 解决 这 个 问题 的 算法 。 

4.3 设 X 为 一 个 大 小 为 的 布尔 数组 。 请 用 CRCW PRAM 模 型 设计 一 个 算法 ， 在 0(1) 时 间 
内 求 出 最 大 的 下 标 k， 使 得 X 为 假 。 

4.4 设 X 和 Y 为 两 个 大 小 分 别 为 x 和 m 的 数组 。rank(a: 了 是 数组 X 中 小 于 或 等 于 a 的 元 素 的 个 
数 。 我 们 定义 rank(X: 了 为 数组 (ri,72,7;…,7,)， 其 中 x; = rank(x : 玉 。 请 设计 一 个 并 行 算 
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4.5 


4.6 


4.7 


4.8 


4.9 


4.10 


4.11 


4.12 


党 一 帝 分 玫 # 辣 奢 滔 右 础 





法 求 出 数组 rank(X:)。 

如 果 对 每 一 个 nj， 都 有 A(i) 和 AG) 相 等 ， 那 么 矩阵 4 为 对 称 矩阵 。 

a) 在 CREW PRAM 模 型 上 设计 一 个 算法 检查 一 个 第 阵 是 否 为 对 称 矩 阵 。 你 设计 的 算 
法 的 复杂 度 是 多 少 ? 

b) 在 CRCW PRAM 模 型 上 设计 一 个 算法 检查 一 个 矩阵 是 否 为 对 称 矩 阵 。 你 设计 的 算 


法 的 复杂 度 是 多 少 ? 
请 设计 一 个 算 苇 将 两 个 n x m 的 矩阵 相 加 ， 并 验证 你 的 算法 是 否 需 用 OCmn) 个 处 理 器 
且 时 间 复 杂 度 为 0(1)。 


如 果 一 个 矩阵 的 对 角 线 以 上 的 元 素 为 零 ， 那 么 该 矩阵 就 叫做 下 三 角 扼 阵 。 给 定 一 个 
和 矩阵 4， 我 们 想 判 断 它 是 否 为 下 三 角 和 矩阵 。 请 在 CREW PRAM 模 型 上 设计 一 个 时 间 复 


杂 度 为 0(1) 的 算法 。 
给 定 阶 为 n x x 的 矩阵 ， 设 计 一 个 算法 求 行 的 所 有 元 素 的 和 。 你 的 算法 的 时 间 和 处 理 
器 复杂 度 是 多 少 ? 


设 4(0:n-1) 为 一 个 大 小 为 x 的 数组 。 范围 内 求 和 问题 就 是 给 定 任意 i 和 j， 求 4(i)， 
A(i+1)….A0) 的 和 ， 其 中 0 < i <j<n-1。 当 i= 0 且 j = n-1 的 时 候 ， 此 问题 成 为 普通 的 
求 和 问题 。 请 设计 一 个 算法 求 对 所 有 可 能 的 i 的 值 的 范围 和 。 

设 A(1:n) 为 一 个 数组 ，B(1:m) 为 另外 一 个 数组 ， 其 中 m < n。 我 们 需要 验证 数组 3 是 
否 为 数组 4 的 子 数 组 。 例 如 ， 假 定 4 = (2,1,7,5,120,5,2,7,1,1,8)，B = (5,120,5,2)， 那 
么 B 为 4 的 子 数组 。 如 果 B = (1,2,7,5)， 那 么 8 不 是 4 的 子 数组 。 

a) 在 CREW PRAM 模 型 上 设计 一 个 算法 验证 数组 8 是 否 为 数组 4 的 子 数组 ， 其 时 间 

复杂 度 为 O(log n); 

b) 对 同一 个 问题 在 CRCW PRAM 模 型 上 设计 一 个 并 行 算法 。 

设计 一 个 并 行 算法 ,输入 是 数组 4(0:n-1)， 求 数组 中 给 定数 的 出 现 次 数 。 例 如 ， 如 
果 4 = (1,2,3,14,12,1,32,3,3)， 那 么 1 出 现 4 次 ，2 出 现 3 次 ，3 出 现 4 次 。 设 计 一 个 并 
行 算法 ， 将 数组 4(0:n-1) 和 x 作为 输入 、 求 x 在 数组 中 的 出 现 次 数 。 

设 A(0:n-1) 为 一 个 数组 ， 数 组 的 模式 指数 组 中 出 现 频率 最 高 的 数 的 值 。 如 果 数 组 
4 = (1,2,3,4,1,5,1,7,1,9,2,8,1,3)， 那 么 1 出 现 5 次 ，2 出 现 2 次 ，3 出 现 2 次 ，4 出 现 1 次 。 
既然 1 出 现 的 次 数 最 多 (5 次 )， 则 数组 的 模式 为 1。 请 设计 一 个 并 行 算法 求 给 定数 组 





第 5 章 树 算 法 


本 音 将 学 习 关 于 树 的 一 些 基本 算法 。 我 们 已 经 学 习 了 欧 拉 图 和 欧 拉 圈 ， 树 是 不 含 圈 的 ， 
树 的 悬挂 点 的 度 是 奇数 1， 因 此 树 不 是 欧 拉 图 。 但 是 我 们 可 以 用 不 同 的 方法 给 出 树 的 欧 拉 圈 的 
定义 ， 并 且 学 习 判 定 树 的 欧 拉 圈 的 方法 。 


5.1 欧 拉 轿 


设 T = (V.E) 是 一 个 图 ,7' 是 由 两 个 有 向 弧 <u, v> 和 <v, u> 代 赫 7 的 每 条 边 (uw) 而 得 到 的 
有 向 图 。 有 向 图 7' 是 欧 拉 图 ，7' 的 欧 拉 圈 也 称 为 7 的 欧 拉 圈 。 假 定 树 用 一 个 相 邻 列表 来 表示 ， 
例如 ， 图 5-1 中 的 树 的 相 邻 列表 如 表 5-1 所 示 。 
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图 5-1 树 


表 5-1 树 的 相 邻 列表 


Vertex (v) adj(v) 
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我 们 用 一 个 有 向 统 列 表 来 表示 图 的 欧 拉 转 ， 欧 拉 圈 为 

{<1, 2><2, 3><3, 2><2, 4><4, 5><5, 6><6, 5><5, 7><7, 5><5, 8><8, 9><9, 8><8, 10 ><10， 
11><11, 10><10, 8><8, 5><5, 4><4, 2><2, 1>} 

这 个 列表 可 以 用 后 继 函 数 来 表示 。 后 继 函 数 (SuccessoD 是 7 的 有 向 弧 集 合 到 它 自 身 的 一 个 
双 射 。 它 可 以 完全 确定 一 个 欧 拉 圈 。 因 此 求 图 的 欧 拉 圈 的 问题 可 以 归结 为 求 后 继 函 数 的 问题 。 
后 继 函 数 定义 如 下 : 考虑 顶点 5， 与 顶点 5 相 邻 的 顶点 有 4，6，7 和 8。 如 果 我 们 考察 欧 拉 圈 ， 
会 发 现 

Successor (<4, 5>)= <5, 6> 
Successor (<6, 9>)= <5, 7> 
Successor (<7, $5>)= <9$, 8> 
Successor (<8, 5>)= <5, 4> 
一 般 情况 下 , 假定 v 是 一 个 顶点 ，wo, ,tw…, ua 是 与 v 相 邻 的 顶点 , 这 里 顶点 v 的 度数 是 d， 

我 们 有 
Successor(<uo, y>) = <v, ui> 
Successor(<ui, y>) = <v, Us> 
Successor(<W,, y>) = <v, Uy> 
Successor(<uy ,Vv>) = <v, Ws_1> 
Successor(<us 1, V>) = <v, U0> 

考虑 带 有 某 些 附加 指针 且 由 相 邻 列表 所 表示 的 树 。 对 于 任意 红 <u, v>， 在 O(1) 时 间 内 可 
以 求 出 <v, uiwmoswm>， 因 此 在 下 面 的 求 树 的 欧 拉 圈 的 并 行 算法 中 ， 需 O(n) 个 处 理 器 ,执行 时 间 
为 0(1)， 用 EREW PRAM 模 型 来 实现 。 

算法 Euler Circuit 

输入 : 具有 附加 指针 且 由 相 邻 列表 所 表示 的 树 7 

输出 : 每 一 个 弧 <u,v> 的 后 继 函 数 Successor(<u,v>) 

1. For every arc <u, v>, do step 2 in parallel 

2. Successor (<u, v>) = <v, w>, where w occurs next to u in the ordered list of vertices 

adjacent to v. If u appears last in the list of vertices adjacent to v, then w is the first node 
in the list 

我 们 已 设计 了 一 个 在 0(1) 时 间 内 求 树 的 欧 拉 圈 的 算法 。 利 用 欧 拉 圈 ， 可 以 解决 许多 有 趣 
的 问题 。 下 面 我 们 首先 研究 如 何 将 一 个 树 变 成 以 给 定 顶点 v 为 根 的 有 根 树 。 


5.2 给 树 加 根 

有 根 树 是 指 以 一 个 顶点 为 根 ， 共 他 顶点 为 后 代 的 树 。 一 个 有 根 树 可 以 用 它 的 双亲 函数 来 
表示 。 图 5-1 中 所 示 的 树 T， 它 可 以 表示 为 以 4 为 根 的 有 根 树 ， 如 图 5-2 所 示 。 我 们 通常 用 双亲 
关系 代替 相 邻 列表 来 表示 一 个 有 根 树 ， 如 表 5-2 所 示 。 
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图 5-2 以 4 为 根 的 树 


表 5-2 双亲 关系 
顶点 1 2 3 4 5 6 7 8 9 10 11 
双亲 2 4 2 4 4 5 5 5 8 8 10 


现在 要 从 相 邻 列表 出 发 来 确定 双亲 函数 ， 为 此 ， 我 们 利用 欧 拉 轿 。 

给 定 的 相 邻 关系 是 : 给 定 p(2) = 4; <2, 1> 出 现在 <1, 2> 之 前 ， 有 p(1) = 2; <2, 3> 出 现在 <3， 
2> 之 前 ， 有 p(2) = 2; <4, 5> 出 现在 <5, 4> 之 前 ， 则 有 p(5) = 4。 

现在 ， 我们 必须 清楚 如 何 确定 一 个 弧 出 现在 另 一 个 弧 之 前 。 给 每 一 个 弧 赋 以 权重 1， 求 加 
权 绝 的 前 缓和。 如果 <u, v> 的 前 缀 和 小 于 <v, u> 的 前 级 和 ， 则 意味 着 <u, v> 出 现在 前 ， 因 而 有 
pP(v) = 4。 下 面 给 出 为 树 加 根 的 并 行 算法 。 

算法 Rooting 

输入 : 

1. 由 相 邻 列表 定义 的 树 T 

2. 由 后 继 函 数 定义 的 7 的 欧 拉 环 游 

3. 特殊 顶点 

输出 : 对 于 每 一 个 顶点 v =r， 输 出 以 "为 根 的 有 根 树 中 的 双亲 p(v) 

1. Identify the last vertex v in the list of vertices adjacent to + and set successor (<u,r>)=0 

2. Assign weight 1 to each arc <u, v> 

3. Find the prefix sum of the weights of the arcs in the list given by the successor function 

4. For each arc <u, v>, do the following in parallel: If the weight of <u, v> is less than the 

weight of <v, u>, then Set p(v} = 

5. End ROOTING 

复杂 度 分 析 ”第 1 ~ 2 步 可 在 O(1) 时 间 内 完成 ; 第 3 步 利 用 第 3 章 中 给 出 的 前 缀 和 算法 ， 用 
O(n) 个 处 理 器 ， 执 行 时 间 为 Odog n); 第 4 步 用 O(n) 个 处 理 器 ， 执 行 时 间 为 0(1); 因此 该 算法 
用 O(n) 个 处 理 器 且 总 的 执行 时 间 为 O(log n)。 由 于 并 行 前 级 和 算法 执行 CREW PRAM 模型 ， 
因此 该 算法 也 执行 CREW PRAM 模 型 。 


5.3 后 序 编号 
本 节 给 出 欧 拉 圈 算法 的 另 一 个 应 用 。 后 序 遍 历 ( postorder traversal) 法 是 顺序 访问 树 的 顶 
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点 的 方法 。 以 "为 根 的 树 7 的 后 序 遍 历 由 从 左 到 右 的 r 的 子 树 的 后 序 遍 历 组 成 ， 其 中 树 根 r 位 于 
最 后 。 例 如 ， 如 图 5-3 所 示 的 简单 树 ，4 是 树 根 ，2，3 和 5 是 4 的 孩子 ， 这 个 树 的 后 序 遍 历 是 1， 
2,3,6,7,11, 10, 8,9,5,4。 





图 5-3 树 


后 序 编号 是 一 个 函数 ， 它 给 出 在 后 序 遍 历 序列 中 顶点 的 排列 。 例 如 ， 图 5-3 中 顶点 的 后 序 编 
号 为 : post (1) = 1; post (2) = 2; post (3) = 3; post (6) = 4; post (7) = 5;.post (11) = 6; post (10) = 7; 
post (8) = 8; post (9) = 9; post ($5) = 10; post (4) = 11 ( 见 表 5-3)。 


表 5-3 后 序 编号 
v 1 2 3 4 5 6 7 8 9 10 11 
post(v) 1 2 3 i1l 10 4 5 8 9 7 6 
后 序 编号 可 以 由 欧 拉 圈 求 出 。 在 欧 拉 圈 中 ， 只 要 沿 着 弧 <v, P(y)> 移 动 ， 都 会 遍历 顶点 v。 
这 个 过 程 由 下 面 几 步 来 描述 : 
1. 对 于 每 一 个 统 <u, v>， 如 果 u 是 v 的 双亲 ， 则 对 弧 <u, v> 赋 权重 0; 如 果 * 是 x 的 双亲 ， 则 对 
弧 <u, 少 峨 权重 1; 


2. 对 于 由 欧 拉 圈 的 后 继 函数 确定 的 列表 ， 执 行 加 权 绝 的 前 组 和 操作 ; 

3. 对 于 每 一 个 顶点 v，post(v) 是 弧 <v, p(Y)> 的 前 组 和 ; 

4. 树 根 的 后 序 编号 为 +:， 其 中 n 是 树 的 顶点 个 数 。 

对 于 图 $-3 所 示 的 树 ， 上 述 过 程 由 表 5-4 给 出 。 表 5-4 给 出 欧 拉 路 ， 权 重 和 前 绥 和 。 算 法 
如 下 : 

算法 Postorder Numbering 

输入 : 

1. 由 双亲 关系 p(v) 给 定 的 以 7 为 根 的 有 根 树 T= (V, E) 

2.7 的 欧 拉 圈 

输出 : 对 于 每 一 个 顶点 v， 后 序 编号 post(v) 

1. For every arc <u, v> do in parallel 

If u = p(v), assign the weight 0, else assign the weight 1 to the arc <u, v>. End Parallel 
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2. Find the prefix sum of the list of weights specified by the successor function 
3. For every vertex v do in parallel 
post(v) = prefix sum of the arc <v, p(y)> 
End parallel 
4.p(r)=n 
5. End Post order Numbering 


表 5-4 后 序 编号 作为 前 缀 和 


欧 拉 路 权重 前 组 和 

(4,2) 0 0 

(2,1) 0 0 

(1.2) 1 1—post (1)=1 
(2,4) 1 2—post (2) =2 
(4,3) 0 2 

(3.4) 1 3 一 post (3)=3 
(4,5) 0 3 

(5,6) 0 3 

(6,5) 1 4—post (6) = 4 
45.7》 0 4 

(7,5) 1 5—post (7)=5 
(5,8) 0 5 

(8,10) 0 5 

(10,11) 0 5 

(11,10) 1 6—post (11)= 6 
(10,8) 1 7=post (10)=7 
(8,5) 1 8~post (8)=8 
(5,9) 0 8 

(9,5) 1 9—post (9)=9 
(5,4) 1 10= post (5)= 10 





复杂 度 分 析 算法 所 用 的 处 理 器 数 为 O(n)， 执 行 时 间 为 O(log n)， 执 行 CREW PRAM 模 型 。 


5.4 后代 个 数 


对 于 每 一 顶点 ， 它 的 后 代 个 数 可 以 由 后 序 编号 算法 中 确定 的 加 权 弧 的 前 级 和 得 到 。 顶 点 
的 后 代 个 数 等 于 以 v 为 根 的 极 大 子 树 的 顶点 个 数 ， 它 是 <p(v), v> 的 前 绥 和 与 <v,p(v)> 的 前 组 和 
的 差 。 例 如 ， 图 5-3 所 示 的 树 ， 根 据 前 缀 和 的 列表 ， 我 们 知道 <4, 5> 和 <5, 4> 的 前 级 和 分 别 为 3 
和 10， 因 此 顶点 5 的 后 代 个 数 是 10-3=7， 也 就 是 说 以 5 为 根 的 极 大 子 树 有 7 个 顶点 (这 7 个 顶点 
是 5，6，7， 8，9，10 和 11)。 弧 <5, 8> 和 <8, 5> 的 前 级 和 分 别 为 5 和 8， 因 此 顶点 8 的 后 代 个 数 
为 3 (分 别 为 顶点 8，10 和 11)。 


5.5 顶点 层 数 


根 的 层 数 为 0。 遍 历 欧 拉 路 。 当 经 过 弧 <p(Y), v> 时 ，p(Y) 的 层 数 比 v 的 层 数 少 1; 而 当 经 过 
弧 <v p(y)> 时 ,vy 的 层 数 比 p(Y) 的 层 数 多 1。 因 而 我 们 给 所 有 形 如 <p(v), v> 的 弧 赋 权重 为 1， 给 
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所 有 形 如 <v, p(v)> 的 弧 赋 权重 为 -1。 在 由 欧 拉 路 确定 的 列表 中 执行 前 级 和 ，Level(v) 就 是 弧 


<p(v), v> 的 前 缀 和 。 表 5-5 表 示 由 图 5-3 所 示 的 树 中 各 顶点 的 层 数 。 


欧 拉 路 


表 5-5 层 数 





(4.2) 
(2,1) 
(12) 
(2,4) 
(4,3) 
(3.4) 
(4,5) 
(5,6) 
(6,5) 
《5,7) 
(7.5) 
(5,8) 
{8,10) 
(10,11) 
(11,10) 
(10,8) 
(8,5) 
(5.9) 
(9,5) 
(5,4) 


5.6 最 低 公共 祖先 


本 节 我 们 研究 关于 有 根 树 的 一 个 非常 有 趣 且 有 用 的 问题 。 在 以 ”为 根 的 有 根 树 7 中 ， 从 顶点 
v 到 /的 路 上 的 顶点 称 为 v 的 祖先 。 给 定 两 个 顶点 4 和 v， 离 根 最 远 的 x 和 v 的 公共 祖先 称 为 x- 和 v 的 最 
会 公共 祖先 ， 并 记 为 LCA (u,v)。 例 如 ， 图 5-3 所 示 的 有 根 树 中 ，LCA(2,6) = 4; LCA(6,10) = 5; 
LCA (7,11)= 5; LCA (8, 11)= 8。 

当 7T 本 身 是 一 个 简单 路 时 ， 两 个 顶点 4 和 v 的 最 低 公共 祖先 是 x 和 v 中 离 根 较 近 的 那个 顶点 。 
人 们 比较 早 地 解决 了 完全 二 叉 树 的 最 低 公共 祖先 问题 。 如 果 7 是 一 个 完全 二 又 树 ， 首 先 给 顶点 
标号 ， 以 便 用 于 顺序 遍历 。 如 果 u 和 v 是 两 个 顶点 的 标号 ， 顶 点 u 和 v 的 最 低 公共 祖先 可 通过 下 


面 步 晴 得 到 : 


前 级 和 


l—>level (2)= 1 
2 1level (1)= 2 
1 

0 

l=»level (3)= 1 
0 

l~>level (5)= 1 
2—level (6)= 2 
1 

2-1level (7)= 2 
1 

2~level (8) = 2 
3=level (10)=3 
4-level (11)=4 


-level (9) = 2 


DD 一 


1. 将 u 和 v 分 别 表示 成 二 进 制 数 x- 和 y。 从 左 端 开 始 比较 x 和 y， 假 设 他 们 在 第 i 位 首次 出 现 不 


同 值 ; 


2. 将 x 和 y 从 左 端 开始 的 前 i-1 位 数 记 为 b， b, 六 
3， u 和 v 的 最 低 公 共 祖 先 标记 为 b， b, by…b, 100…0。 
例如 : u =47,， v= 61，u 和 v 的 二 进 制 表示 分 别 为 


u= 101111 
v= 111101 
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从 左 到 右 比 较 w 和 和 v 的 二 进 制 表示 ， 不 同 字 位 的 位 置 在 第 二 个 ， 因 此 4 = 47 和 * = 61 的 最 低 
公共 祖先 的 二 进 制 表示 为 110 000， 即 LCA(47, 61) = 48。 

一 般 有 根 树 的 最 低 公共 祖先 本 节 给 出 求 一 般 有 根 树 的 最 低 公共 祖先 的 方法 。 利 用 树 的 欧 
拉 圈 ， 首 先 求 以 根 为 起 点 的 树 的 欧 拉 圈 。 这 个 欧 拉 圈 肯 定 是 弧 的 一 个 列表 。 在 这 个 列表 中 ， 
用 顶点 4 来 代替 弧 <u, v>， 则 在 列表 的 起 始 位 置 恰好 是 树 根 。 我 们 称 这 个 列表 为 欧 拉 数组 4。 
例如 ， 图 5$-3 给 出 的 有 根 树 的 欧 拉 数组 为 A =(4, 2, 1, 2, 4, 3, 4, 5, 6, 5,7, 5, 8, 10, 11, 10, 8, 5,9, 
5)。 欧 拉 数 组 4 的 一 般 形 式 为 : 

A= (a, a,,", an) 
假定 8 =(b,, 5,…,b,)， 这 里 b, 表示 树 7 中 顶点 4 的 层 数 。 对 于 图 5-3 所 示 的 树 ， 有 
B=(0,1,2,1,0,1,0,1,2,1,2,1,2,1,2,3,4,3,2,1,2,1) 


进一步 ， 我 们 还 定义 另外 两 个 数组 必 v) 和 xr(v)。 对 于 每 一 个 顶点 v，il(Y) 是 指 在 数组 4 中 v 在 
最 左边 出 现时 的 指标 ，r(v) 是 指 在 数组 A 中 v 在 最 右边 出 现时 的 指标 。 对 于 图 5-3 所 示 的 树 ，l(v) 
和 r(v) 由 表 5-6 给 出 。 


表 5-6 I(v) 和 r(v) 的 值 


顶点 v 1 2 3 4 5 6 7 8 9 10 11 
lv) 3 2 6 1 8 9 11 13 19 14 15 
r(v) 3 4 6 21 20 9 11 17 19 16 15 





A=(4,2,1,2,4,3,4,5,6,5,7,5,8,10,1],10,8,5,9,5,4) 
B=(0,1,2,1,0,1,0,1,2,1,2,1,2,3,4,3,2,1,2,1,0) 


我 们 从 以 根 为 起 点 的 欧 拉 路 出 发 ， 执 行 深度 优先 搜索 法 。 在 执行 过 程 中 首先 从 v 的 双亲 到 
v， 利 用 最 左边 出 现 的 a; = v， 得 到 level(a, 1) + 1 = levele )。 类 似 地 ， 仅 当 访 问 完 以 "为 根 的 子 
树 上 的 所 有 顶点 后 ，v* 才 能 返回 到 它 的 双亲 。 如 果 已 经 由 > 返回 到 v 的 双亲 ， 就 不 会 再 回 到 v。 
因此 ， 利 用 最 右边 出 现 的 w = v*， 有 ax = * 的 双亲 。 所 以 ， 最 右边 出 现 的 w = v， 当 上 且 仅 当 
level(a)-1 = level(a)。 综 上 所 述 ， 我 们 有 如 下 结论 : 

定理 5-1 

1. 给 定数 组 A，a;= VvV 是 在 数组 和 A 中 v 的 最 左边 出 现 ， 当 且 仅 当 level(a;) + 1 = level(a); 

2. 4a)= Vv 是 数组 A 中 v 的 最 右边 出 现 ， 当 且 仅 当 level(a)--1 = level(aj,i)。 

由 于 在 欧 拉 圈 中 采用 深度 优先 搜索 法 ， 我 们 有 如 下 结论 : 

定理 5-2 

1. 是 y 的 祖先 ， 当 且 仅 当 !Kz) < iv) < ro ; 

2. 如 果 u 不 是 v 的 祖先 且 v 不 是 4 的 祖先 ， 我 们 称 w 和 v 是 不 相关 的 。U 和 v 是 不 相关 的 ， 当 且 
仅 当 要 么 r(u) < l(v)， 要 么 r(v) < (ww)。 

当 u 是 vy 的 祖先 时 ， 有 LCA(u, v) = wu;， 当 x 和 v 不 相关 时 ， 必 须 用 数组 8 求 LCA(u,v)。 由 观察 
知 LCA(uw) 出 现在 u 到 vy 的 路 上 。 当 wu 和 v 不 相关 时 ， 不 失 一 般 性 ， 假 定 r-(w) < Kv)， 则 LCA(u,v) 
位 于 最 右边 出 现 的 4 与 最 左边 出 现 的 v 之 间 的 欧 拉 路 中 ， 这 部 分 的 欧 拉 路 仅仅 访问 从 u 到 v 这 条 
路 上 的 顶点 以 及 它们 的 后 代 。 因 此 在 这 部 分 的 欧 拉 路 具有 最 小 层 数 的 顶点 是 LCA(u,v)。 因 此 
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我 们 有 如 下 结论 : 
定理 5-3 如 果 r(u) < 1(v)， 那 么 LCA(U,v) 是 在 从 r( 册 ) 到 L(V) 的 区 间 上 具有 最 小 层 数 的 顶点 。 
综 上 所 述 ， 我 们 得 到 下 面 的 算法 。 
算法 LCA 
输入 : 
1. 基于 双亲 关系 的 有 根 树 T 
2. 两 个 节点 u 和 和 v 
输出 : LCA(u,v) 
. Find the Euler path beginning from the root 


iD 一 


. In the Euler path, replace every arc (u, v) by vertex u and insert root at the beginning and 
get the array A 

Find array B = (b,, b,,…,b,), where 0 = level number of ai, the ith entry of A 

For every vertex x of T. Find 7(x) and r(x), using the arrays A and B 

If 1(u) < tv) < r(n), then set LCA(u, v) = u and return 

If < I(u) < r(v), then set LCA(u, v) = v and return 

If ro < Lv set i = (r(u) and j = Il(v), else set i = r(v) and j = i(n) 

Choose the index k that is minimum in {6,, bin, Da 

LCA(u, v) = a 

End LCA 


复杂 度 分 析 求 欧 拉 路 和 顶点 的 层 数 所 用 的 时 间 为 0(1)， 求 1(x) 和 r(x) 所 用 的 时 间 也 为 
O(1)。 这 表明 第 1 ~ 4 步 的 执行 时 间 为 0(1)， 第 5 ~ 7 步 执 行 时 间 为 0(1); 第 8 步 是 范围 最 小 问 
题 ， 通 过 对 数组 的 预 处 理 ， 求 范围 最 小 所 需 时 间 也 为 0(1),， 但 预 处 理 需 要 处 理 器 数 为 O(n 
log n)， 执行 时 间 为 O(log n)。 因 此 LCA 问 题 的 总 复杂 度 是 用 OCn log nn) 个 处 理 器 ， 执 行 时 
间 为 O(log n)。 


5.7 树 收缩 


树 收缩 十指 收缩 一 个 二 叉 树 ， 并 把 它 表示 成 仅 含有 三 个 顶点 的 完全 二 又 树 的 系统 方法 。 
这 可 以 应 用 到 算术 表达 式 计 算 中 。 本 节 我 们 研究 树 收缩 算法 ， 下 一 节 我 们 研究 它 在 算术 表达 
式 中 的 应 用 。 例 如 ， 考 虚 (2*x+4*y) / (2+a)， 这 个 算术 表达 式 将 被 表示 成 如 图 5-4a 所 示 的 二 又 
树 。 每 一 个 内 部 顶点 表示 一 个 运算 ， 每 一 个 叶子 顶点 表示 一 个 运算 数 。 

为 了 计算 这 个 表达 式 ， 首 先 计 算出 2*x, 4*y 和 2+a 的 表达 式 ( 见 图 5-4b) ; 然后 将 2*x 和 
4*y 加 起 来 ( 见 图 5-4c) ; 最 后 ，2*x+4+y 被 2+a 除 ( 见 图 5-4c)。 这 里 ， 原 来 的 树 被 收缩 成 最 后 
含有 表达 式 值 的 树 。 为 了 收缩 树 ， 我 们 引入 运算 rake。 

rake 运 算 ”考虑 二 又 树 T = (V, E)， 每 个 内 部 顶点 恰 有 两 个 孩子 。 假 设 v 是 叶 节 点 但 不 是 根 
;的 孩子 。 记 pv) 表 示 v 的 双亲 ，s(v) 表 示 v 的 兄弟 。 对 v 的 rake 运 算 ( 见 图 5-5) 步 又 如 下 : 

1. 去 掉 顶 点 v 和 p(y); 

2. 使 得 s(v) 为 p(v) 的 双亲 的 核子 。 


Cm 
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人 
人 


b) c) 
5-4 
a) (2*x+4*y) / (2+a) b) 收缩 树 c) 收缩 树 


一 个 
parent (p(v)) 一 \、 parent (p(V)) -一 ~、 


sibling (V) 





rake 运 算 后 


sibling (v) 
fake 运 算 前 


图 5-5 rake 运 算 


现在 考察 rake 运 算是 否 能 够 对 许多 时 节点 同时 执行 。 如 果 两 个 顶点 z 和 "是 兄弟 ， 对 w 和 "同时 
进行 rake 运 算 可 能 产生 某 些 混 乱 。 类 似 地 ， 如 果 x 的 双亲 是 "的 祖父 母 ， 同 时 执行 rake 运 算 也 可 能 
产生 冲突 。 为 了 选择 顶点 使 得 可 以 同时 对 它们 执行 rake 运 算 ， 去 掉 最 左边 和 最 右边 的 时节 点， 然 
后 从 左 到 右 对 叶 节 点 进行 编号 。 假 设 它们 分 别 记 为 L, 芽 , 上 …,L,。 例 如 ， 在 图 5-6a 所 示 的 树 中 
Li=5;L,= 8;L;= 12;L=13;L;= 10 
记 Lw 表 示 具 有 奇数 编号 的 叶子 ， 即 , , L;, 4,…。 在 Low 的 元素 中 ， 有 些 是 它们 相应 的 双 
亲 的 左 孩子 ， 有 些 是 右 和 孩子， 我 们 对 左 孩 子 的 元 素 做 rake 运 算 ， 然 后 再 对 其 他 元 素 做 rake 运 算 。 





112 党 二 疤 分 图 机 型 划 法 





例如 ， 图 5-6a 所 示 的 树 中 ，L = (4, DZ) = (5,12,10)。 在 Low 中 ，5 是 它 的 双亲 的 右 孩子 ，12 
和 10 是 它们 的 双亲 的 左 孩 子 ， 我 们 首先 同时 对 12 和 10 做 rake 运 算 ， 然 后 再 对 5 做 rake 运 算 。 这 个 
过 程 用 图 5-7 所 示 的 树 来 描述 。 图 5-7a 表 示 有 10 个 时节 点 的 树 ， 在 第 1 次 迭代 中 , 工 有 8 个 叶子 : 
L=(12,14,15,5,8,16,18,19) 
Lu = (12, 15, 8, 18) 





图 5-6 
a) rake 运 算 前 b) rake 运 算 后 
在 Lo 的 成 员 中 ，12, 8 和 18 是 左 孩 子 ，15 是 右 孩 子 ， 因 此 我 们 首先 对 12，8 和 18 同 时 执行 
rake 运 算 ， 然 后 再 对 15 执 行 rake 运 算 ( 见 图 5-7a, b 和 c)。 在 每 个 图 中 ， 下 一 次 将 要 进行 rake 运 
算 的 顶点 用 粗 体 表示 。 在 第 2 次 欠 代 中 ，Z 中 有 4 个 元 素 : 
| L=(14,5,16,19) 
La = (14, 16) 





图 5-7 
a) 树 。 第 1 次 夺 代 , 工 =(12,. 14, 15,5,8,16,18,19),L=(12,15,8,18) 
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图 5-7 ( 续 ) 
b) 对 12, 8, 18 同 时 做 完 rake 运 算 后 ， 对 15 做 rake 运 算 c) 对 15 做 完 rake 运 算 后 ， 执 行 第 2 次 迭代 ， 
了 =(14, 5, 16, 19), Lows =(14, 16)， 对 左 孩 子 16 做 rake 运 算 ， 然 后 对 右 孩 子 14 做 rake 运 算 
d) 对 16 做 完 rake 运 算 后 ， 再 对 14 做 rake 运 算 “) 对 14 做 完 rake 运 算 后 ， 第 3 步 
迭代 中 ， 我们 有 新 的 值 民 = (5, 19)，L = (5)， 对 5 做 rake 运 算 


oo 
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f ) 


图 5-7 〈 续 ) 
f ) 对 5 做 完 rake 运 算 后 ， 做 最 后 一 次 达 代 , 二 = (19), Low = (19)， 对 19 做 rake 运 算 
8) 对 19 做 完 rake 运 算 后 ， 我 们 得 到 仅 含有 王 个 节点 的 树 


这 里 16 是 左 孩子 ，14 是 右 孩 子 。 因 此 ， 我 们 首先 对 16 做 rake 运 算 ， 然 后 再 对 14 做 rake 运 算 
( 见 图 5-7c, d 和 e)。 在 第 3 次 迭代 中 , 工 = (5, 19)，ZL = (5)， 我 们 仅 对 5 做 rake 运 算 ( 见 图 5-7e 
和 有 。 在 最 后 一 次 迭代 中 , 工 = (19)，P = (19)。 对 19 做 完 rake 运 算 后 ， 我 们 得 到 有 三 个 节点 
的 完全 二 又 树 ( 见 图 5-7g)。 

我 们 注意 到 ， 开 始 时 L 中 有 8 个 元 素 ， 经 过 每 一 次 从 代 ，L 中 的 元 素 减 半 ， 因 此 如 果 最 初 
工 中 有 7 个 叶 节 点 ， 我 们 得 到 有 三 个 节点 的 完全 二 又 树 夫 需要 OUlog 门 次 迭代 ， 每 一 次 迭代 包 
含 两 步 ， 每 一 步 用 O(n) 个 处 理 器 执行 0(1) 时 间 。 因 此 树 的 收缩 算法 总 的 时 间 复 杂 度 是 用 
O(n) 个 处 理 器 ,执行 时 间 为 Ollog n)， 执行 EREW PRAM 模 型 。 现 在 我 们 给 出 树 的 收缩 算法 
的 描述 。 

算法 Tree Contraction 

输入 : 

1. 有 根 二 叉 树 T7， 其 每 一 个 非 叶 子 节点 恰 有 两 个 孩子 

2. 对 每 个 顶点 v 的 p(v) 和 s(v) 

输出 : 由 原始 树 收缩 得 到 的 三 节点 完全 树 

1. Do the following log(n + 1) iterations 

1.1 Number the leaf nodes from left to right, leaving the leftmost and the rightmost node. 
Let L denote this ordered list of leaves, which are left children 
1.2 Apply the rake operation concurrently on all the nodes of Loss which are right children 


2. End Tree Contraction 


现在 我 们 研究 树 收缩 算法 的 一 个 很 重要 的 应 用 一 一 算术 表达 式 的 计算 (arithmetic 


expression evaluation ) 。 


5.8 算术 表达 式 的 计算 


我 们 已 经 清楚 如 何 将 一 个 算术 表达 式 表示 成 二 叉 树 ( 见 图 5-4)。 从 树 的 最 底层 计算 表达 
式 的 值 ， 这 个 bottom-up 方 法 进行 表达 式 计算 所 需 的 时 间 为 O(n)。 本 节 我 们 用 树 收 缩 算法 ， 在 
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O(log n) 时 间 内 计算 表达 式 ， 所 用 处 理 器 数 为 O(n)。 为 了 求 出 表达 式 的 值 val(7)， 我 们 首先 确 
定 以 内 部 节点 4 为 根 的 子 表达 式 的 值 val(w)， 每 一 节点 u 对 应 一 个 实数 对 (p,, 4,)。 
如 果 u 是 一 个 节点 ， 它 的 孩子 是 vc 和 w， 则 val(x) = {p, val(v) + q,} * {p, Val(w) + 4.}， 这 里 * 
表示 节点 u 处 的 运算 符 ( 见 图 5-8)。 例 如 ， 考 虚 如 图 5-9 所 示 的 树 ， 表 达 式 的 值 是 {8*5+3}* 
{(—2)*1+20}=(43)*(18)=774。 
对 于 一 般 的 树 ， 对 每 一 个 节点 置 (p, 9) = (1,0)。 当 对 v 做 rake 运 算 时 ， 在 得 到 的 树 中 我 们 要 
调整 节点 的 (p, 9) 值 ， 这 样 使 得 表达 式 最 后 的 值 不 受 影响 。 考 虚 图 5-10 所 示 的 树 ， 假 定 在 节点 u 
的 运算 是 *， 叶 节点 u 含 有 一 个 常数 c。 
现在 对 节点 v 做 rake 运 算 ， 做 完 rake 运 算 后 ， 得 到 如 图 5-10b 所 示 的 树 。w 的 值 与 rake 运 算 
之 前 的 X 的 值 相同 ， 但 是 (p,, 9,) 变 成 了 ,9.)。 


(pu qu) 





图 5-8 有 ,9) 值 的 树 
(pw qw) 





p(u) 


(pw qw) 
、 
b) 


(8,3) Cs) (2) (1,20) 图 5-10 161 


a) rake 运 算 之 前 的 树 b) 对 节点 v 做 
图 5-9 有 (p,9) 值 的 小 树 rake 运 算 后 的 树 


因此 , 在 对 v 做 rake 运 算 时 X 的 值 不 必 已 知 。 我 们 将 选择 p, 和 q,, 使 得 表达 式 的 值 不 受 影响 。 
在 rake 运 算 之 前 ， 节 点 u 对 其 双亲 的 值 所 作 的 贡献 为 p, * val(%) + go， 
即 
pr{p,* C+q.}* (pr.*X+4)+q. 
= {p,* (p,* c+q,)*p,} *X+{p,* (p,* c+4)* 4q,+q.} 
如 果 在 rake 运 算 后 我 们 想 保持 同一 个 值 ， 则 有 下 列 等 式 : 
pu=p.* (p,* C+q,)*p, 
q,=p.* (p,*Cc+q)*4q,.+q, 
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在 这 个 过 程 中 w 和 X 的 值 不 受 影响 。 
假定 x 含 有 + 运算 ， 则 类 似 地 可 以 得 到 


p»=p.*p, 
q»=p.* (p,* C+4q,)* q,+q, 

利用 上 面 的 公式 ，p% 和 4 可 在 O(1) 时 间 内 求 出 ， 因 此 利用 改进 的 树 收缩 算法 来 计算 算术 
表达 式 的 值 需 O(n) 个 处 理 器 ， 执 行 时 间 为 O(log n)， 这 里 表示 表达 式 中 运算 数 的 个 数 。 

这 个 过 程 用 图 5-11a ~ g 来 描述 。 图 5-11a 表 示 算 术 表 达 式 ， 这 类 似 于 图 5-7a 中 所 示 的 树 。 
用 于 图 5-7a ~ g 的 rake 运 算 ， 按 相同 顺序 ， 可 用 于 图 5-11a ~ g。 粗 体 节 点 表示 下 一 次 要 做 rake 
运算 的 节点 。 我 们 注意 到 ， 在 rake 运 算 后 (p, 9) 改 变 了 。 在 每 一 阶段 ， 都 可 以 验证 树 的 值 是 
2925。 





图 5-11 
a) 算术 表达 式 为 val(7) = {(10+12*(14+15))+5}+{(8+(16+18*19))*7}=2925 的 树 T 
b) 对 12,8,18 执 行 rake 运 算 后 c) 对 15 执 行 rake 运 算 后 
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(1,0) 






(1,0) (18,24) (1,0) 


d) 





(366,0) 


(1,353) (10) 


8) 


图 5-11 《 续 ) 
d) 对 16 执 行 rake 运 算 后 e) 对 14 执 行 rake 运 算 后 f) 对 5 执行 rake 运 算 后 
2) val(D) = {10+353} + {7*366} = 2925 


5.9 森林 求 根 问题 


我 们 知道 树 是 无 圈 的 连通 图 ， 而 无 圈 的 图 称 作 琳 林 。 换 句 话 说 ， 树 的 集合 称 作 森 林 。 图 
5-12 表 示 有 12 个 节点 的 森林 。 

记 R(v) 为 树 的 根 ， 其 中 节点 v 是 该 树 的 成 员 。 表 5-7 中 R 的 值 为 图 5-12 中 各 节点 的 R 值 。 

我 们 将 使 用 指针 跳 转 法 来 设计 一 个 算法 ， 并 利用 这 个 算法 来 求 每 个 节点 的 R(YV) 值 。 对 每 个 
节点 v、 开 始 时 并 行 地 选取 R(v) = parent(v)。 如 果 R(Y) 是 根 ， 则 必 有 R(R(Y)) = R(v)。 直 到 我 们 
得 到 R(R(v)) = R(v)， 并 记 R(v) = R(R(V))。 如 图 5-13 所 示 的 森林 ， 表 5-8 给 出 了 每 一 阶段 的 Ri) 

的 值 。 
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图 5-12 森林 和 它 的 双亲 关系 


表 5-7 图 5-12 所 示 的 森林 的 根 数组 





图 5-13 含有 39 个 节点 的 森林 











表 5-8 图 5-13 所 示 的 森林 求 根 问题 











1 1 1 
2 2 2 1 
3 1 1 ”2 
4 1 1 1 
5 2 2 1 
6 2 2 1 
7 1 1 1 
8 1 1 2 
1 1 29 18 13 6 2 
2 2 30 25 22 12 1 
1 1 31 26 22 12 1 
1 1 32 26 22 12 1 
2 2 33 28 18 10 2 
2 2 34 28 18 10 2 
1 1 35 28 18 10 2 
1 1 36 31 26 15 1 
2 2 37 31 26 15 1 
2 2 38 33 28 13 2 
2 2 39 34 28 13 2 
2 2 


算法 Find-Root 
输入 : 由 数组 PARENT (1:n) 表 示 的 森林 
输出 : R(1:n) 
BEGIN 
1. For i = i to n do in parallel 
2. R(i) = PARENT (i) 
3. while R(i) and R(R(i)) are not equal do 
4. ROi) = R(R(i)) 
5. Endwhile 
6. End Parallel 
END 
复杂 度 分 析 ”显然 所 需 的 处 理 器 数 为 0(n)。 第 3 ~ 5 步 的 For 循 环 至 多 重复 [log n] 次 ， 这 是 
因为 : 开始 时 R(v) = PARENT(v)， 因 此 R(Y) 给 出 与 v 距 离 为 1 的 v 的 祖先 。 当 我 们 对 R(R(v)) 赋 值 
时 ， 距 离 加 倍 。 因 此 树 的 总 高 度 就 是 被 遍历 的 次 数 [log 有 ]， 这 里 h 是 树 的 高 度 。 但 是 由 于 h < n， 
因此 算法 的 计算 时 间 为 O(log n)。 当 执行 第 4 步 时 ， 有 两 个 读 操作 ， 一 个 是 R(i)， 另 一 个 是 
R(R(i))。 对 于 两 个 不 同 的 i，R(i) 的 值 有 可 能 相等 ， 因 此 会 发 生 并 发 读 操作 ， 而 并 发 写 操作 不 
可 能 发 生 。 因 此 这 个 算法 执行 CREW PRAM 模 型 。 


5.10 到 根 的 路 
作为 指针 跳 转 法 的 另 一 个 例子 ， 我 们 给 出 求 任意 一 个 树 的 每 个 节点 与 根 之 间 路 的 问题 。 


一 
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假定 了 = (V, 局 是 以 "为 根 的 有 根 树 ， 并 且 用 双亲 关系 来 表示 。 
如 果 v 不 是 树 根 ，PARENT(v) 表 示 树 中 节点 v 的 双亲 ; 如 果 v =r 是 树 根 ， 则 PARENT(v) = r。 
最 初 我 们 只 有 从 每 个 节点 到 它 双亲 的 长 度 为 1 的 路 ， 在 下 一 阶段 、 所 有 的 指向 根 方向 长 度 
至 多 为 2 的 路 被 求 出 ， 然 后 所 有 的 指向 根 方向 长 度 至 多 为 4 的 路 被 求 出 ， 继 续 这 个 过 程 ， 从 每 
个 节点 到 根 的 所 有 的 路 经 过 [log 同步 被 求 出 ， 这 里 1 是 树 的 高 度 。 路 用 变量 PATH 来 表示 ， 
PATHC) 表 示 从 节点 "到 根 的 路 ， 它 由 一 系列 相 邻 节点 组 成 。 在 第 1 阶段 ， 假 定 
PATH (1) = (1, 2, 7) 
PATH (7) = (7, 9, 3) 
我 们 记 
PATH (1)/PATH (7)=(1, 2, 7, 9, 3) 
记号 // 用 于 连接 具有 公共 端点 的 两 条 路 ， 以 形成 一 条 较 长 的 路 。 我 们 还 定义 另 一 变量 ANC(Y) 
(祖先 )。 最 初 有 ANC(v) = PARENT(v),， 并且 PATH(v) = (v, PARENT(v))。 
下 一 阶段 ， 用 下 面 的 运算 来 求 从 v 开 始 指向 根 方向 的 较 长 的 路 : 
PATH(y) = PATH(v)Y/PATH(ANC(Y)) 


更 新 ANC 的 值 : 
ANC(vy) = ANC(ANC(Y)) 


这 样 我 们 可 以 求 出 具有 较 长 距离 的 祖先 。 注意 v 到 ANC(v) 的 路 已 经 建立 起 来 ， 我 们 又 一 次 将 路 
的 长 度 加 售 
PATH(y) = PATH(v)/PATH(ANC(»)) 


对 每 个 节点 ， 用 [log 门 步 ， 这 个 过 程 给 出 从 节点 到 根 的 路 ， 这 里 jp 是 树 的 高 度 。 下 面 用 一 
个 例子 来 描述 上 述 过 程 。 考 虑 图 5-14a 所 示 的 树 ， 树 的 高 度 为 4， 这 个 树 用 双亲 关系 表示 出 来 。 
最 初 我 们 给 出 路 和 祖先 的 值 ， 如 图 5-14b。 图 5-14c， 图 5-144， 图 5-14e 分 别 表 示 经 过 第 1,2 阶 
段 后 的 位 置 。 第 2 阶段 后 ，PATH(1), PATH(2), PATH(3), PATH(4), PATH(5), PATH(6), PATH(9)， 
PATH(I0) 和 PATH(12) 的 长 度 与 第 1 阶段 的 值 相 同 ， 因 为 它们 相应 的 ANC 的 值 都 是 根 3。 我 们 仅 
对 节点 "延长 这 条 路 ; 这 里 ，v 满 足 ANC(v) 不 是 树 根 这 一 条 件 。 并 行 算法 如 下 : 


算法 Tree-Path 
输入 : 给 定 由 每 个 顶点 v 的 PARENT(v) 组 成 的 树 T= (V, E) 
输出 : 对 每 个 v E V 的 PATH(Y) 
BEGIN 
1. For all v €E V do in parallel 
ANC(y) = PARENT(y)PATH(y) = (v, PARENT(Y)) 
End Parallel 
2. Repeat the following steps [log h] times where h is the height of the tree. If h is not 
given its maximum value n~1 must be considered where n is number of vertices 
2.1 Forally€E Vdoin Parallel 
2.2 If ANC(v) is not root 
PATH(y) = PATH(v)//PATH(ANC(»)) 





ANC(v) = ANC (ANC(Y)) 


2.3 Endif 
2.4 End Parallel 
END Tree Path 
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PATH(1) 
ANC(1)=2 


PATH(5) 
ANC(5)=12 


PATH(10) 
ANC(10)=12 


(7) 
(9 


PATH(14) 
ANC(14)=7 


? 9? 


PATH(2) 
ANC(2)=3 


(9) 
(6) 


PATH(6) 
ANC(6)=9 


(8) 
QD) 


PATH(11) 
ANC(11)=9 


PATH(15) 
ANC(15)=6 


PATH(3) 
ANC(3)=3 


PATH(7) 
ANC(7)=5 


PATH(12) 
ANC(12)-3 


b) 
图 5-14 


PATH(4) 
ANC(4)=3 


(8) (9) 
PATH(8) PATH(9) 
ANC(8)=10 ”ANC(9)=12 


(6) 
四 


PATH(13) 
ANC(13)=6 


a) 树 T b) 最 初 阶段 的 了 
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/7 777 


PATH() PATHI5) PATH(6) PATH PATH(8) 
ANC(1)=3 ANC(5)=3 ANC(6)=12 ANC(7=12 ANC(8)=12 


fi 


PATH(13) PATH(14) PATH(15) PATH(9) PATH(10) PATH(11) 
ANC(13)=9 ANC(14)=5 ANC(15)}=9 ANC(9)=3 ANC(10)=3 ANC(11)=10 


PATH(6) PATH7) PATH(8) 
ANC(6)=3 ANC(7)=3 ANC(8)=3 








PATH(11) PATH(13) PATH(14) PATH(15) 
ANC(11}=3 ANC(13F3 ANC(14F3 ANC(15)=3 
e) 
图 5-14 ( 续 ) 


c) 第 1 阶段 的 一 些 路 d) 第 2 阶段 的 一 些 路 e) 第 2 阶段 的 一 些 路 
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这 个 算法 需 0(0) 个 处 理 器 ， 执 行 时 间 为 O(log h)。 由 于 ANC(v) 可 能 对 多 个 节点 v 而 言 其 值 
相同 ， 因 此 ， 该 算法 执行 CREW PRAM 模 型 。 


5.11 树 变 为 二 又 树 


表示 树 的 常用 数据 结构 是 一 维 数组 PARENT， 它 给 出 了 顶点 的 双亲 表示 。 
如 果 u 不 是 根 ，PARENT(w) = 4 的 双亲 ; 如 果 x 是 根 ，PARENT( = u。 
例如 ， 图 5-15 所 示 的 树 ， 表 5-9 给 出 了 其 双亲 关系 ， 但 是 这 个 数据 结构 并 不 能 很 有 效 地 处 
理 树 的 结构 。 因 此 我 们 需要 将 树 转 变 成 二 叉 树 。 只 有 转变 成 二 叉 树 后 ， 运 算 才 能 有 效 地 执行 。 
为 了 便于 操作 ， 我 们 用 1, 2,…, nn 来 表示 顶点 。 对 于 任 一 顶点 i， 它 的 孩子 的 指标 从 左 到 右 依次 
增加 ， 因 此 最 左边 的 孩子 有 最 小 的 指标 。 将 一 个 树 变 成 二 叉 树 的 方法 如 下 : 设 i 是 一 个 顶点 ， 
是 ;的 孩子 ， 满 足 < i <i… <ii。 在 二 又 树 中 ， 
i 的 左 孩 子 是 ii;，. 
的 在 孩 子 是 P 
i 的 右 孩 子 是 ; 


i 的 右 孩子 是 i 





图 5-15 树 及 它 的 双亲 关系 
表 5-9 双亲 关系 
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上 述 过 程 见 图 5-16， 二 又 和 料 用 3 个 一 维 数组 PARENT，LCHILD 和 RCHILD 表 示 。 


LCHILDG) = 二 又 树 中 i 的 左 孩 子 
171 RCHILDGQ) = 二 又 树 中 i 的 右 护 子 





图 5-16 树 变 为 二 又 树 


当 一 个 树 转 变 成 二 又 树 时 ， 我 们 已 经 看 到 具有 最 小 指标 的 i 的 孩子 被 选 为 的 左 孩 子 。 顶 点 
i 的 右边 是 ;的 兄弟 ， 具 有 大 于 i 的 最 小 指标 。 
LCHILDC) = i 的 具有 最 小 指标 的 孩子 
RCHILDG) = 具有 大 于 ;的 最 小 指标 的 ;的 兄弟 
更 正式 地 ， 可 写 为 : 
j, 如 果 j = min {Kk/parent(k) = 分 


LCHILDG) = | 
0, 如 果 不 存 在 顶点 使 得 其 双亲 是 i 


jj, 如果 j = min {k> i/parent(i) = parent(K)} 
0, 如 果 不 存 在 顶点 使 得 parent(i) = parent(k) 


图 5-17 表 示 一 个 树 及 它 的 二 又 树 表 示 ， 表 5-10 给 出 了 PARENT,LCHILD 和 RCHILD 的 值 。 
172 为 了 求 出 LCHILD 和 RCHILD 的 值 ， 必 须 首 先 将 顶点 按 升序 排序 ， 用 这 种 方式 使 得 LCHILD 
和 RCHILD 的 值 很 容易 求 出。 输出 LCHILD 和 RCHILD 数 组 的 并 行 算法 如 下 : 
算法 Binary-Tree 
输入 : PARENT(1:n) 
输出 : LCHILD(1:n), RCHILD(1:n) 
BEGIN 
1. Arrange the nodes in a convenient order so that the evaluation can be done efficiently 


RCHILD(i) = | 


2. For i= 1 to n do in parallel 
3. Find LCHILD{i) and RCHILD(D, using the formula given above 
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4. End Parallel 
END 





图 5-17 树 及 其 二 又 树 表 示 


表 5-10 双亲 ， 左 孩子 和 右 孩 子 





节点 i PARENT(i) LCHILDQ) RCHILD(D 
1 7 2 3 
2 1 8 5 
3 7 0 0 
4 8 0 6 
5 1 0 9 
6 8 0 0 
7 7 1 0 174 
8 2 4 0 
9 1 0 0 





上 面 的 算法 用 O(m) 个 处 理 器 ， 执 行 时 间 为 O(log n)， 且 执行 CREW PRAM 模 型 。 


5.12 顶点 直径 


本 节 我 们 研究 求 一 个 树 的 所 有 顶点 的 直径 的 并 行 算法 。 树 7 的 顶点 v 的 直径 是 指 从 v 到 7 的 


所 有 共 他 顶点 的 最 长 路 的 长 度 。 即 


dia(v) = Max {d(vy w)w ET} 


这 里 d(vw) 表 示 从 v 到 w 的 最 短 距离 。 


算法 是 根据 树 的 如 下 两 个 性 质 设计 的 ， 首 先 我 们 给 出 这 两 个 性 质 的 描述 和 证 明 。 





个 
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定理 5-4 假定 T=(V,) 是 一 个 树 ，u,v 是 T 的 两 个 顶点 且 对 每 一 个 顶点 i EV， 有 
Max {d(i,u), d(i,v)} «< d(uwv) 
则 对 任意 的 iE Y， 有 dia(D = Max {d(i,w), diy)}。 特 别 地 ， 从 x 到 ?的 路 是 7 中 的 最 长 路 之 一 。 
证 明 : 由 简单 的 观察 可 知 w 和 v 都 是 叶 节 点 。 假 定 i 和 和 j 是 7 的 两 个 任意 的 顶点 ， 我 们 将 证 明 
d(ij) < Max {d(i,u), d(i,v)} 
如 果 上 式 成 立 ， 因 为 是 7 的 任意 顶点 ， 所 以 等 式 dia() = Max {d(i,u), d(iwv)} 成 立 。 现 在 来 证 明 
d(ij) < Max {d(iu), d(i,v)} 
假定 w 是 从 wu 到 v 的 路 中 最 靠近 j 的 顶点 ， 根 据 假定 ， 我 们 有 dO,v) < d(u,v)。 因 而 有 
dG,w) = dO ww)-d(v ww) & d(uwv)-d(v,w) 
< d(uw) + d(v,w)—d(v,w) 


= d(w,u) 

类 似 地 ， 利 用 

GO & d(u,v) 
我 们 可 以 证 明 

dOJw) & d(w,v) 
我 们 将 利用 这 两 个 结论 来 完成 证 明 : 

dO,w) & d(w,u) 

dO,w) & d(wwv) 


情形 1 

假设 从 u 到 vy 的 路 与 从 i 到 ;的 路 有 一 些 公共 顶点 ， 并 注意 到 
d(iw) + d(w,u) = d(i,u) 
d(i,w) + d(w,v) = d(iyv) 


由 前 一 种 情形 ， 有 
dlij) = d(i,w) + d(w, )) 
< d(iw) + d(wu) 
= d(i,u) 
由 后 一 种 情形 ， 有 
d(i,)) = dliw) + d(w,)) 
< d(i,w) + d(w,v) 
= d(i,y) 
因此 有 
d(ij) < Max {d(i,u), d(i,v)} 
情形 2 


假设 从 4 到 v 的 路 与 从 i 到 j 的 路 没有 公共 顶点 。 假 定 j" 是 从 i 到 j 的 路 上 距 w 最 近 的 顶点 。 容 易 
看 出 
dO',)) < djw) < d(wu) 
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因而 
d(i,)) = d(i,j') + dO",7) 
< d(i,j') + d(w, u) 
< d(i,j') + dO',w) + d(w, u) 
= d(i,u) 
类 似 地 ， 可 以 证 明 d(i, 站 < dli,v)。 因 此 有 
d(i, j)) < Max {d(i,u), d(i,v)} 
定理 得 证 。 
定理 5-5 ”假定 7 是 一 个 树 ，14 是 7 的 一 个 顶点 ， 则 对 于 任 一 满足 dia(u) = du 人 的 顶点 天 ， 了 
中 有 一 条 最 长 路 ， 其 中 类 是 它 的 一 个 终点 。 
证 明 : ”考虑 T 是 以 4 为 根 的 有 根 树 。 按 照 定理 中 x 的 选取 知 ，k 是 一 个 叶 节 点 ,假定 v, w 是 T 
的 两 个 顶点 , 户 是 v 和 w 的 最 低 公 共 祖 先 。 
情形 1 
假定 j 是 的 祖先 ， 由 k 的 选取 有 


d( jv) < d( jh) 
d( jw) < d( jh) 
注意 到 
dv = dQv,)) + d( jh 
或 
d(w,k) = d(w) + dO, 
因此 
d(vw) = d( jv) + dO,w) 
< Max {d(v,h), d(w,k)} 
情形 2 


假定 不 是 上 的 祖先 ,是 5 和 j 的 最 低 公 共 祖 先 ， 有 
dl(v,}j) < dlv, j) 
和 
d(w, )) < d(w, j') 
又 根据 x 的 条 件 ， 进 一 步 有 
dQv, ji) < d( j,k) 
因而 
d(vw) = d(v,)) + d(w, )) 
< d(v, ji) + dw, ) 
< d(k, ji) + d(w, ji) 
= d(w,k) 
我 们 也 可 以 证 明 d(vw) < dv,。 因 而 有 d(v,w) < Max {d(w,D, d(v,h)}。 
由 情形 1 和 情形 2， 可 以 得 到 
d(v,w) < Max {d(w,k), dv k)} 


心 
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从 上 面 不 等 式 立 即 可 得 到 定理 的 结论 。 
下 面 我 们 给 出 求 树 的 所 有 顶点 的 直径 的 算法 。 
算法 Diameter 
输入 : 树 T=(V,E) 
输出 : dia(),iEV 
BEGIN 
1. Choose an arbitrary vertex i €E V and compute {d(i, jj EV 
178 2. Find the maximum of the set {d(ij)/j € V} and the vertex u, such that d(i,u) is the 
maximum. So, dia(i) = d(i,n) 
3. Compute {d(u, w)/w EV} . 
Choose the maximum of {d(u, w/w E V} and find the vertex v GE V, such that dia(u) = 
d(u,v) 
5. Compute {d(v, iNi EV} 
6. For each vertex j E V do in parallel 
7 
8 


全 


dia(l)) = Max {d(u,)), dv, ))} 


. End parallel 
END 
此 算法 需 用 O(n/log n) 个 处 理 器 ， 执 行 时 间 为 O(log n)。 
5.13 最 远 邻 居 


假定 7 = (V,E) 是 一 个 树 ， 且 每 一 条 边 有 一 个 正 实数 权重 。 如 果 dia(x) = dx， 则 顶点 v 称 
为 顶点 4 的 最 远 邻 居 ， 这 里 d(u,v) 表 示 从 u 到 v 的 路 上 所 有 边 的 权重 之 和 ，dia(w) 表 示 u 的 直径。 
注意 ,一 个 顶点 可 能 不 止 一 个 最 远 邻 居 。 例 如 ， 图 5-18 所 示 的 树 、 顶 点 w 有 三 个 最 远 邻 居 x,;y 和 
z。 对 于 任 一 个 图 ， 可 以 通过 计算 图 的 相 邻 算 阵 的 传递 闭 包 (transitive closure ) 来 计算 每 个 顶 
点 的 最 远 邻 居 。 传 递 闭 包 的 计算 所 用 的 处 理 器 数 为 O(n’)， 执 行 时 间 为 O(log? n)。 





图 5-18 wu 的 最 远 令 居 x,y 和 z 
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但 是 对 于 树 来 说 ，Ghosh 和 Maheswari (1992) 已 经 证 明 ， 如 果 一 个 树 的 最 长 路 位 于 顶点 4 和 
v 之 间 ， 那 么 每 个 顶点 的 最 远 邻 居 或 者 是 x， 或 者 是 v。 利 用 这 个 性 质 ， 我 们 设计 了 一 个 有 效 的 
并 行 算法 。 
首先 定义 几 个 记号 : 
P(uwv) 表 示 树 中 从 x 到 v 的 惟一 的 一 条 路 ; 
D(uywv) = wu 和 v 之 间 的 距离 
=P(u,v) 的 边 的 权重 和 ; 
P(uw)MP(x;y) 表 示 P(uwv) 和 P(x,y) 公 共 的 极 长 路 。 
树 T 的 直径 为 树 的 最 长 路 ， 即 含有 最 大 权重 的 路 。 一 个 树 不 止 一 条 直径 ， 和 但 是 都 有 相同 的 
长 度 。 下面 给 出 一 些 有 趣 的 性 质 。 
定理 5-6 ”如果 本 和 由 分 别 是 7 中 zx 和 y 的 最 远 邻 居 ， 则 Pa 和 Pvw) 必 相交 。 
证 明 : 假定 P(uw) 和 P(v,v) 不 相交 ( 见 图 5-19)。 考 虑 从 4 到 Vv 的 路 ，P(uwv) 经 过 Pl(ux)， 然 
后 分 开 ， 并 且 交 Pvwv) 于 y 点 ， 由 观察 得 到 
D(x,ui) 2 D(x,y) + D(y,v)) 
DQ) 2 DOX) + D(X) 
由 这 两 个 不 等 式 ， 得 : 
D(xy) «0 


X 


y 
图 5-19 Plu, tw) 和 PQy,v) 不 相交 
这 与 已 知 相 了 矛盾， 因为 每 一 条 边 都 含有 正 的 权重 。 因 此 PQ,w) 和 Pv,wvi) 必 相交 。 
推论 一 个 顶点 和 它 的 最 远 邻 居间 的 路 总 是 与 树 的 所 有 的 直径 相交 。 180 
定理 5-7 ”假定 P(uwv) 是 树 T = (V,E) 的 一 个 直径 ， 则 对 于 任 一 顶点 x E V， 或 者 4 是 x 的 最 远 


邻居 ， 或 者 y 是 x 的 最 远 邻 居 。 
证 明 : 假定 Pu) 是 一 直径 ，x E VY 是 任 一 顶点 ，? 是 zx 最 远 邻 居 。 我 们 只 要 证 明 


DJy) = DO 
或 

D(x,y) = D(x,v) 
由 推论 ，P(x;y) 和 P(uw) 相 交 ， 记 
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Per MN Pluw) = Pp,q) 
P 是 P(u,9) 中 的 顶点 ， 我 们 得 到 
D(q,v) > D(q,y) 
因为 P(uwv) 是 直径 ， 又 因为 y 是 x 的 最 远 邻 居 ， 有 
Dlgq, y) > D(g») 


因而 得 到 

D(q;y) = D(qw) 
因此 有 

D(x,y) = D(xw) 
定理 得 证 。 


如 果 已 知 树 T 的 直径 P(u,v)， 通过 比较 D(x,w) 和 D(x,v)， 可 以 求 出 7 的 每 个 顶点 x 的 最 远 邻 居 ， 


因此 ， 必 须 首先 求 直径 ， 定 理 5-5 给 出 了 求 直径 的 过 程 。 下 面 我 们 给 出 求 树 的 直径 的 过 程 : 


1. x 是 任意 顶点 ; 

2.y 是 x+ 的 最 远 邻 居 ; 

3.z 是 y 的 最 远 邻 居 ; 

4. PCyx) 是 T 的 直径 。 

如 果 已 经 求 出 PO,z)， 那 么 ， 对 于 任 一 顶点 x E V，u 的 最 远 邻 居 为 


4 | 如果 DQ) > DG 
z, 否则 
可 以 证 明 上 述 方 法 需要 O(n/log nn) 个 处 理 器 ， 执 行 时 间 为 O(log 站 。 
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习题 


5.1 


5.2 


5.3 


5.4 


5.5 


5.6 


5.7 


5.8 


5.9 


假定 树 7 用 它 的 相 邻 列表 来 表示 。 相 邻 列表 仅 是 一 个 线性 列表 。 设 计 一 个 算法 来 求 欧 
拉 环 游 。 

树 的 前 序 遍 历 由 根 r 的 遍历 及 从 左 到 右 的 根 r 的 每 一 个 子 树 的 前 序 遍 历 组 成 。 设 计 一 
个 并 行 算法 在 O(log n) 时 间 内 得 到 每 个 顶点 v 的 前 序 编号 ， 利用 EREW PRAM 模型 。 
假定 7 = (V,E) 是 一 个 树 ，s(v) 表 示 v 的 下 一 个 兄弟 ，c(v) 表 示 v 的 第 一 个 孩子 。 由 这 两 
个 值 ， 设 计 一 个 并 行 算法 来 求 每 个 顶点 v 的 双亲 。 

一 个 有 根 二 又 树 的 中 缓 次序 遍历 先 从 根 r 的 左 子 树 的 中 缀 次 序 遍 历 开 始 ， 接 着 是 "的 
遍历 ， 最 后 是 r 的 右 子 树 的 中 缀 次 序 遍历 。 设 计 一 个 算法 在 O(log 刀 时 间 内 求 各 个 顶 
点 的 中 绥 次 序 编号 。 

一 个 二 叉 树 中 ， 各 个 顶点 v 有 权重 w(v)， 对 于 每 个 顶点 v，5S(v) 表 示 以 v 为 根 的 子 树 中 
所 有 顶点 的 权重 和 。 设 计 一 个 算法 求 每 个 顶点 v 的 S(v)。 

对 于 顶点 v， 如 果 去 掉 v 后 所 得 到 的 子 树 的 大 小 小 于 或 等 于 n， 则 称 v 为 树 T 的 形 心 。 这 
里 表示 树 T 的 顶点 数 。 设 计 一 个 算法 在 O(log n) 时 间 内 求 T 的 形 心 。 算 法 执行 EREW 
PRAM 模 型 。 

假定 7 是 一 个 树 ， 我 们 想 给 树 加 根 使 得 树 的 高 度 最 小 。 设 计 一 个 并 行 算法 来 选取 一 个 
顶点 v， 并 把 它 作 为 7 的 根 ， 满 足 T 具 有 最 小 高 度 。 

假定 T= (V,E) 是 以 r 为 根 的 有 根 树 ，size(Y) 表 示 以 7 为 根 的 子 树 的 项 点 个 数 。 设 计 一 个 
并 行 算 法 求 size(v), v EV。 

假定 X(1:n) = (x x2…, x) 是 一 列 不 同 数 的 数组 。 如 果 i < j, a: <w， 则 称 (a, oj) 是 匹配 
对 。 设 计 一 个 并 行 算法 来 标识 这 个 数组 的 所 有 匹配 对 。 


5.10 假定 T 是 一 个 有 根 树 ， 对 于 每 个 顶点 v，v 的 后 代 个 数 记 为 des(v)。 设 计 一 个 并 行 算法 


来 求 每 个 顶点 v 的 des(v)。 
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许多 实际 生活 情形 用 图 来 描述 ， 甚 至 许多 社会 生活 问题 也 用 图 来 描述 。 例 如 一 个 机 构 里 
工作 人 员 之 间 的 人 际 关 系 可 以 用 图 来 描述 和 研究 。 交 通 系 统 、 商 业 系 统 、 工 作 表 、 设 备 供给 
等 问题 都 可 以 用 图 模型 来 描述 和 分 析 。 计 算 机 产生 以 后 ， 图 论 研 究 得 到 飞速 发 展 ， 图 算法 得 
到 广泛 应 用 。 人 们 设计 了 各 种 图 问题 的 有 效 算法 。 最 近 几 年 ， 关 于 图 问题 的 并 行 算法 的 设计 
和 分 析 成 为 一 个 非常 有 用 的 研究 课题 。 


6.1 简单 图 算法 

本 节 我 们 对 许多 简单 图 问题 设计 并 行 算法 。 首 先 考虑 一 些 容易 的 图 问题 。 让 我 们 从 确定 
顶点 的 度 出 发 。 考 虑 图 问题 时 ， 我 们 假定 数据 结构 在 算法 设计 中 扮演 着 重要 角色 。 假 定 图 用 
它 的 相 邻 矩阵 表示 。 下 面 研 究 如 何 设 计 一 个 算法 去 求 图 的 每 个 顶点 的 度 。 

定理 6-1 假定 G = (V,E) 是 一 个 简单 图 ，n 和 m 分 别 表 示 图 的 顶点 和 边 的 个 数 ， 图 的 顶点 用 
整数 1 到 nm 来 表示 。 假 定 4 是 图 G 的 相 邻 拭 阵 ， 则 顶点 ;的 度 为 

d= 3 AD) 

证 明 : 根据 相 邻 惩 阵 的 定义 ， 
1, 与 / 相 邻 
0,i 与 不 相 邻 
因此 ， A(i, 站 给 出 了 与 关联 的 边 的 数目 。 定 理 得 证 。 
考虑 图 6-1 的 图 ， 它 的 相 邻 矩 阵 为 


A(i,)) -| 


OOOO 
已 己 它 一 一 已 一 
OOOOOCOO— 
号 
OPO 和 OO 
OOO 
已 一 号 一 一 叫 王 


顶点 ;的 度 是 指 相 邻 矩阵 第 ; 行 的 行 元 素 和 ， 即 d(1) = 3; d(2) = 3; d(3) = 2; d(4) = 4; d(5) = 3; 
d(6) = 3; 4(7) = 2。 下 面 的 并 行 算法 用 来 求 图 的 每 个 顶点 的 度 。 
算法 Degree 
输入 : 相 邻 算 阵 4(1:m, 1:n) 
输出 : 度数 d(1:n) 
BEGIN 
1. Fori= 1 ton do in parallel 
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2.d0)= > AGi,)) 
3. End parallel 
END 


5 
图 6-1 图 G 


上 面 算法 的 第 2 步 是 求 x 个 数 的 和 ， 因 而 用 O(n/log nn) 个 处 理 器 ， 执 行 时 间 为 O(log n)。 求 
图 的 所 有 顶点 的 度 所 用 的 处 理 器 数 为 O(nYlog n)， 执 行 时 间 为 O(log n)。 注 意 第 1 ~ 3 步 并 行 执 
行 ， 用 EREW PRAM 模 型 。 因 此 可 用 EREW 模 型 来 实现 这 个 算法 。 

上 面 这 个 算法 非常 容易 ， 但 是 经 常 被 使 用 。 现 在 我 们 讨论 度 算法 的 一 个 非常 有 趣 的 应 用 。 

一 个 图 称 为 欧 拉 图 ， 当 且 仅 当 有 一 条 闭 通道 经 过 图 的 每 一 条 边 且 恰 好 经 过 一 次 。 欧 拉 定 
理 表明 一 个 图 是 欧 拉 图 ， 当 且 仅 当 它 不 含有 奇数 度 的 顶点 。 因 此 为 了 检验 一 个 图 是 否 是 欧 拉 
图 ， 充 要 条 件 是 检验 它 是 否 含有 奇数 度 的 顶点 。 下 面 的 算法 确定 一 个 图 是 否 是 欧 拉 图 。eu 是 
一 个 布尔 数组 ， 如 果 顶 点 v 的 度 是 偶数 ， 则 eu(v) = true; 反之 ，eu(v) = false。 如 果 对 图 的 所 有 
顶点 v 都 有 eu(v) = true ， 则 该 图 是 欧 拉 图 。 

算法 Euler 

输入 : 图 G = (V,E) 

输出 : 布尔 变量 EULER 的 值 

BEGIN 
, Find the degree of each of the vertex of G 


[Ss> 


. For each vertex v of G do in parallel 
,If dv) is odd 


eu(vy) = false 


(iD 


else 
eu(y) = true 
endif 
. End Parallel 
.EULER = Boolean AND of all the eu(v) 
END 
上 面 算 靶 中 ， 第 1 步 执行 度 算法 ， 第 2 ~ 4 步 所 用 的 处 理 器 数 为 O(n)， 执 行 时 间 为 0(1)。 第 
5 步 执行 "个 布尔 值 的 AND 运 算 ， 这 一 步 的 复杂 度 依赖 于 PRAM 模 型 : 如 果 是 EREW PRAM 模 
型 ， 则 需要 O(n) 个 处 理 器 ， 执 行 时 间 为 O(log n); 如 果 是 ERCW PRAM 模 型 ， 则 需要 C(o) 个 处 
理 器 ， 执 行 时 间 为 0(1)。 这 个 算法 的 总 的 复杂 度 是 用 O(n”) 个 处 理 器 ， 执 行 时 间 为 O(log )。 


un 太 


un 





另 一 个 度 算法 的 应 用 是 检验 顶点 集 是 否 组 成 一 个 团 。 给 定 相 邻 矩阵 4，C 表 示 给 定 图 
G = (V,E) 的 顶点 子 集 。 对 任 一 顶点 v， .< 40 四 给 出 了 C 中 与 " 相 邻 的 顶点 数 ， 因 此 ，C 是 一 
个 困 ， 当 且 仅 当 对 C 中 的 每 个 顶点 "， 有 了 ,A(v,u)= ICI-1。 下 面 算法 能 检验 C 是 否 形成 一 个 
团 。 在 算法 中 ，dc(v) 表 示 C 中 与 顶点 v 相 邻 的 顶点 个 数 。C 是 一 个 团 当 且 仅 当 dc(v) = ICI-1， 
此 ， 如 果 C 有 Kk 个 顶点 ， 则 C 是 一 个 团 当 且 仅 当 对 C 中 的 每 个 顶点 v，dc(v) = k-1。 为 了 验证 这 
个 结论 , 求 d= ,dc(v)。d 等 于 C 中 边 数 的 两 倍 。 因 此 C 是 一 个 团 当 且 仅 当 d = K(k-1)。 现 在 
给 出 这 一 算法 : 
算法 Clique-EW 


输出 : 布尔 值 CLIQUE 
BEGIN (Let k denote ICD) 
1. For each vertex v EC do in Parallel 
2. dc(y) = > Acy) 
3. End Parallel 
4. d= > dcOv) 
5. If d = KK-1) then 
CLIQUE = True 
else 
CLIQUE = False 
End if 
END 


在 这 个 算法 中 ,第 1 ~ 3 步 用 O(kK”) 个 处 理 器 ， 执 行 时 间 为 O(log 月 ; 第 4 步 仅 用 0(h) 个 处 理 
器 ， 执 行 时 间 为 O(log k)。 因 此 ， 这 个 算法 采用 EREW PRAM 模 型 共 需 处 理 器 数 为 O(C) ， 执 
行 时 间 为 O(log 如。 如 果 PRAM 模 型 是 ERCW， 则 需 用 处 理 器 数 为 0(k")， 执 行 时 间 为 0(1)。 
算法 如 下 : 
算法 Clique-CW 
输入 : 
1. 图 G = (Ye) 的 相 邻 矩阵 4 
2. 顶点 集 C 
输出 : 布尔 值 CLIQUE 
BEGIN 
Let 大 be the number of vertices in C 
1.CLIQUE = True 
2. For each v,x E C such thaty 关 wx do in Parallel 
3. If A(v, u) = 0 then 
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CLIQUE = False 
End if 
4. End Parallel 
END 


上 面 算法 中 ， 对 于 C 的 每 一 对 顶点 uv， 用 独立 的 处 理 器 验证 是 否 有 A(u,v) = 0。 如 果 有 
A(u,vy) = 0， 则 返回 “false” 值 给 布尔 变量 CLIQUE。 这 里 ， 不止 一 个 处 理 器 试图 写 和 CLIQUE 
的 同一 个 位 置 。 在 并 发 写 操作 中 ， 产 生 冲 突 时 则 可 用 任意 冲突 解决 机 制 来 解决 。 给 定 的 顶点 
集 可 以 在 O(R) 个 处 理 器 上 用 0O(1) 时 间 来 检验 是 否 它 形成 一 个 团 , 这 里 是 给 定 集合 的 顶点 个 数 。 
现在 我 们 讨论 图 论 中 的 一 个 非常 重要 的 问题 。 

6.2 并 行 连通 度 算法 

广度 优先 搜索 (Breadth-First Search) 和 深度 优先 搜索 (Depth-First Search) 是 图 的 两 个 
重要 的 搜索 技术 ， 它 们 也 用 来 检验 一 个 图 是 否 是 连通 支 。 给 定 一 个 图 ， 求 出 它 的 连通 支 是 一 
个 很 有 趣 的 问题 。 如 图 6-2 所 示 ， 它 有 四 个 连通 支 。 人 们 设计 了 许多 并 行 算法 来 求 无 向 图 的 连 
通 支 。 所 有 这 些 算法 都 可 以 用 下 面 两 个 主要 策略 对 它们 进行 分 类 。 

1. 所 使 用 的 基本 技术 ; 

2. 输入 的 格式 。 


1 8 9 


图 6-2 非 连通 树 


目前 的 所 有 算法 ， 使 用 的 基本 技术 是 下 面 三 个 中 的 一 个 : (1) 广度 优先 搜索 (BFS); (2) 
传递 闭 包 (Transitive Closure) ; (3) 顶点 收缩 (Vertex Collapse )。 输 入 的 最 常用 的 形式 是 
相 邻 矩阵 。 相 邻 从 阵 的 广泛 使 用 是 因为 它 可 以 描述 成 图 的 理论 问题 并 且 可 以 看 作 和 矩阵 问题 来 
求解 。 对 于 稠密 图 这 些 策 略 可 以 很 好 的 使 用 ， 但 是 对 于 稀疏 图 可 能 会 产生 无 效 算法 。 因 此 ， 
我 们 经 常 输入 相 邻 列表 。 而 求 连 通 支 的 大 多 数 算法 都 是 非常 一 般 的 算法 、 其 中 有 一 些 算法 适 
合 稀 玻 图 或 稠密 图 。 


6.2.1 广度 优先 搜索 (BFS) 


图 的 BFS 首 先 访 问 一 个 顶点 ， 记 为 v， 访问 完 v 后 ， 再 访问 与 距离 为 1 的 所 有 顶点 ， 然 后 是 
距离 为 2 的 所 有 顶点 ， 如 此 继续 下 去 ， 直 到 访问 完 所 有 的 顶点 。 例 如 ， 考 虑 如 图 6-5a 所 示 的 图 ， 
如 果 BEFS 从 1 开始 ,首先 访问 1， 然 后 访问 2 和 3; 由 于 4 和 5 都 与 :和 3 相 邻 ， 再 访问 4 和 5， 接 下 
来 访问 6， 没 有 更 多 的 顶点 与 4 和 5 相 邻 ， 因 此 访问 与 6 相 邻 的 点 ， 即 接 下 来 访问 7， 然 后 访问 与 
7 相 邻 的 8 和 9。 为 了 了 解 如 何 并 行 执行 BFS ， 下 面 介绍 一 些 概念 。 

设 G = (V, 思 是 一 个 图 ，x E V，K 是 一 整数 且 满 足 0<k< [log 四 ， 其 中 是 顶点 个 数 。T(v. 
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表示 以 "为 根 的 树 ， 它 的 所 有 的 顶点 从 * 开 始 经 过 一 条 小 于 或 等 于 2 长 度 的 路 到 达 ， 图 6-3 表 示 一 
个 图 及 T(u,0)，T(u,1) 和 T(u,2)。 又 设 G 的 子 图 7 = (Vi,E7) 是 一 个 有 根 树 ， 如 果 对 于 任意 两 个 顶点 
uv E Vr，(uw) E 已 ， 要 么 它们 位 于 7 的 同一 慨 ， 要 么 位 于 7 的 相 邻 层 ， 则 称 7 具 有 BFS 特 性 。 
6-4 描 述 了 BFS 特 性 。 如 果 Ttv 及 具有 BFS 特 性 ， 则 称 Ttv 妈 为 C 的 大 树 ， 也 称 为 BFS 树 。 下 面 我 
们 考虑 如 何 将 BFS 并 行 化 。T(v,0) 以 v 作 为 根 且 以 它 的 所 有 邻居 作为 孩子 。 对 于 7T(v,0) 中 的 每 一 
个 顶点 x， 合 并 T(u,0) 到 T(v,0) 中 而 得 到 Tv,1)。 一 般 地 ， 对 于 任 一 个 满足 条 件 0 < k< [log 的， 
对 于 T(v,k-1) 最 低层 的 每 一 个 顶点 4， 合 并 T(u,k-1) 到 TCv,x-1) 中 ， 则 v 是 所 得 树 的 根 。 下 面 的 
并 行 算法 用 来 求 任 一 顶点 v 的 BFS 支 撑 树 T(y, log n)。 


T(u,0) T(u,1) 






图 G 





因为 (36) 是 G 的 边 ， 此 柑 
不 具有 BFS 特 性 
具有 BFS 特 性 的 树 


图 6-4 图 和 具有 BFS 特 性 的 树 
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T(1,0) T(2,0) T(3,0) T(4,0) 
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T(5.0) 3 Telo“ § To Te 0 T(9,0) 
b) 
XY 代 .4 
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1 T(4,1) 7 和 
T(5,1) 25! 8、9 


8 T(6,1) 
人 
8 9 7 
T(7,1) 
6 


T(8,1) T(9,1) 


图 6-5 
a) 无 向 图 G_ b) TG,0),v=0,1,2,…,9 ©) Ty,1),v=1,2,.…,9 
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T(3,2) 





算法 BFS 
输入 : 图 G = (V,E) 
输出 : 从 每 个 顶点 开始 的 G 的 BFS 支 撑 树 
BEGIN 
1. For every vertex v EV do in Parallel 
Find T(y, 0) 
End Parallel 
2.k=0 
3. While k< [logn do 
k=k+t+l1 
For every vertex v E V do in Parallel 
For every vertex u at the lowest level of T(v, k—1) do in Parallel 
Merge T(u, k—1) with T(v, k—1) such that v is the root of the resulting tree which is 
denoted by T(v, k) 
End Parallel 
End Parallel 
END 
图 6-5a ~ d 具 体 描述 了 上 述 算法 。 合 并 树 T(xK-D 到 Tv-1D 共 需 时 间 为 0dog n)， 算 法 的 
while 循 环 共 执行 1og n 次 ， 因 此 该 算法 共 需 时 间 为 O(log? n)。 在 算法 中 有 两 个 贱 套 的 并 行 循 环 ， 
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可 以 证 明 合 并 操作 需要 O(n) 个 处 理 器 。 因 此 算法 共 需 要 O(n”) 个 处 理 器 。 
6.2.2 利用 BFS 搜 索 连 通 支 


设 T(v， [og]) 是 以 v 为 根 的 G 的 BFS 支 撑 树 ，P(uwv) 表 示 T(v, [log 2]) 中 的 双亲 。 如 果 G 不 是 连 
通 图 ， 上 述 BFS 算 法 的 输出 结果 是 什么 ? T(v，[1og ?1]) 将 不 是 图 G 的 支撑 树 或 支撑 森林 ，T(v， 
[log 中]) 仅 仅 是 包含 "的 G 的 连通 支 的 支撑 树 。 为 简单 起 见 ， 记 BFS(w) 为 Tow，[log "1])。 如 果 G 不 是 连 
通 的 ，P(uw) 仅 仅 定义 在 从 v 可 到 达 的 顶点 4 上 。 如 果 从 vy 不 可 到 达 x， 则 定义 P(uw) = % 。 简 而 言 之 ， ”L191 

Pp [em 如 果 u 是 BFS(Y) 的 顶点 
(u,v) = 
%， 否 则 

为 方便 起 见 ， 我 们 记 顶 点 为 1, 2, 3,…, n， 定 义 连通 度 矩 阵 为 
o, 如 果 P(i, 站 = % 

i, 否则 

在 连通 度 矩 阵 中 ， 顶 点 ) 的 分 支 数 是 指 包含 的 分 支 的 最 小 顶点 ， 即 / 列 的 最 小 元 素 。 考 虑 
图 6-6a 和 它们 的 BFS 树 ， 即 图 6-6b， 乞 阵 PG, 力 和 CG, 旋 如 下 : 


co)-| 


1 2 3 7 
192 
5 6 4 8 
a) 
1 
5 6 2 5 6 4 3 
BFS(1) BFS(2) BFS(3) BFS(4) 
5 6 7 8 9 
| 1 
6 193 
2 1 2 5 8 9 7 9 7 8 
BFS(5) BFS(6) ”BFS(7) BFS(8) BFS(9) 
b) 
图 6-6 


a) 图 G b) 得 到 的 BFS 树 
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顶点 j 的 分 支 数 是 矩阵 C 的 第 j 列 的 最 小 数 。 图 6-6a 中 ， 


顶点 ;， 1 2 3 4 5 6 7 
分 支 数 : 1 1 3 3 1 1 7 


CREW 模 型 下 基于 上 述 方法 的 并 行 算法 如 下 : 
算法 CC-BFS 
输入 : 图 G = (VE) 
输出 : 每 个 顶点 v 的 分 支 数 
BEGIN 
1. Using ALGORITHM BFS construct the BFS trees BFS(CV) 
for each v E V in Parallel 
2. For i = 1 to n do in Parallel 
Forj = 1 to n do in Parallel 
If P(i, 7)) = % then 
COE,D=% 
else 
C(i,)D)=i 
End if 
End Parallel 
3. Forj= 1 ton do in parallel 
CompQ) = Min {CG,),i= 1,2,.…n} 


‘Oo0N8 3332 
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End Parallel 
END 
BFS 算 法 的 复杂 度 是 用 O(n”) 个 处 理 器 ， 执 行 时 间 为 O(log? n)。 第 2 步 用 O(n 个 处 理 器 ， 执 
行 时 间 为 0(1)。 取 最 小 值 所 需 处 理 器 数 为 O(n)， 执 行 时 间 为 O(log n)， 所 以 ， 第 3 步 需要 O(n”) 
个 处 理 器 ， 执 行 时 间 为 O(log n)。 因 此 ， 上 述 算 法 用 CREW PRAM 模 型 共 需 O(n”) 个 处 理 器 ， 
执行 时 间 为 O(log? n)。 


6.2.3 ”传递 闭 包 和 矩 阵 


根据 图 G = (V,E) 的 相 邻 矩阵 4, 通过 计算 (4 + "可 以 得 到 传递 闭 包 矩阵 ,并 i 记 R = (4 + 站 ， 
1， 在 G 的 同一 分 支 中 ， 如 果 i 与 j 相 邻 
0， 否 则 
顶点 的 分 支 数 是 使 得 R(i, 有 站 = 1 的 最 小 指标 j。 并 行 算 法 为 : 
算法 CC-TRC 
输入 : 图 的 相 邻 矩阵 4(, 方 
输出 : 每 个 顶点 的 分 支 数 
BEGIN 


1. Obtain the transitive closure matrix R from the adjacency matrix 


RD -| 


2. Fori= 1 ton do in Parallel 
Comp(i) = Min U/R(Gi,)) = 1} 
End Parallel 
END 
算法 的 复杂 度 依赖 于 和 矩阵 乘法 的 复杂 度 。 对 于 CRCW PRAM 模 型 ,计算 R 需 要 O(n”) 个 处 
理 器 ， 共 需 时 间 为 O(log n)。 对 于 CREW PRAM 模 型 ， 计 算 R 需 要 0O(m’) 个 处 理 器 ， 共 需 时 间 为 
O(log? n)。 由 于 第 2 步 仅 需 O(n”) 个 处 理 器 ， 执 行 时 间 为 O(log n)， 因 此 总 的 计算 复杂 度 为 : 





模型 时 间 处 理 器 
CRCW O(log n) O(n’) 
CREW O(log’ n) O(n’) 


6.2.4 顶点 收缩 


1976 年 ，Hirschberg 首 先 提出 了 求 图 的 连通 支 的 顶点 收缩 法 。 相 邻 的 顶点 合并 组 成 一 个 
“ 超 点 ”。 超 点 重复 地 连接 成 它们 的 超 点 ， 重 复 上 面 过 程 直到 每 一 个 分 支 用 一 个 超 点 表示 。 已 
经 证 明 ， 要 达到 最 后 阶段 共 需 执行 [log n] 次 重复 操作 。 每 一 个 过 程 由 以 下 三 步 组 成 : 

1. 找 出 每 个 顶点 具有 最 低 标号 的 相 邻 超 点 。 

2. 每 个 超 点 的 根 与 最 低 标号 的 相 邻 超 点 的 根 相连 。 

3. 所 有 新 得 到 的 相连 的 超 点 收缩 成 一 个 较 大 的 超 点 。 

最 初 ， 每 一 个 顶点 被 看 作 超 点 ，sup(i) 表 示 i 的 超 点 ，nhr(i) 表 示 i 的 最 低 标号 的 相 邻 超 点 。 


195 


= 
小 
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上 面 算法 描述 如 下 : 
BEGIN 
l. Fori=1]tondo 
sup(D) = 
2. Fork= 1 to [log nj do 
2(a) Fori= 1 ton do 
Compute the lowest numbered neighboring Supernode and call it nbr(2). If i has no 
neighboring supernode assign nbr(i) = sup(?) 
end for 
2(b) Fori= 1 ton do 
Among all vertices whose supernode is i choose the vertex j 
with minimum nbrO) value 
Assign nbr(i) = nbrQ) 
If there is no such vertex assign nbr(i) = sup(i) 
sup(i) = nbr(?) 
2(c) For p = 1 to [log n] do 
Fori=1tondo 
nbr(i) = nbrnbr(i)) 
end for 
end for 
197 2(d) Fori= 1tondo 
sup(i) = Min {nbr(i), sup(nbr(i))} 
end for 
END 
输入 是 图 的 相 邻 矩阵 A(1:n, 1:n)， 输 出 是 sup(i)， 其 最 后 给 出 了 在 含有 i 的 分 支 中 最 低 标号 
的 顶点 。 算 法 的 执行 过 程 如 图 6-7a ~ 6-7e 所 示 ， 下 面 给 出 一 个 完整 的 并 行 算法 ， 执 行 CREW 
PRAM 模 型 。 
算法 CC-VC 


输入 : 相 邻 矩 阵 4[1:m, 1:n] 
198 输出 : sup[1: 四 在 最 终结 果 中 sup(D 是 最 小 的 顶点 且 ; 和 sup(D 属 于 同一 分 支 


BEGIN 
1. Fori= 1 ton do in parallel 
Sup(D = 
End Parallel 


2. For k= 1 to [log n] do 
2(a) For i = 1 to n do in parallel 
nbr(i) = Min {supQ)/A(i,)) = 1 and 1 <j<n)} 
If nbr( does not exist 
nbr(i) = sup(?) 
end if 
end parallel 
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2(b) For i= 1 to n do in Parallel 
nbr(D = Min {nbrQ)/supQ) = iand nbrO) = 及 
If no such vertex j exists then 
nbr(i) = Sup(D 
end if 
Sup(D = nbr(i) 
End Parallel 
2(c) For p= 1 to [log nl] do 
Fori= 1 ton do in Parallel 
nbr(i) = nbr(nbr(7)) 
end parallel 
end for 
2(d) For i= 1 to n do in parallel 
sup(i) = Min {nbr(i), sup(nbr(i))} 
end parallel 
END 


2 3 
1 § 
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a) 原始 图 b) 初始 化 sup(i) = ic) 迭代 一 次 ，nbr(i) 
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1 | 
4 7 5 6 8 
d) 
4 
6) 


图 6-7 ( 续 ) 
d) 迭代 一 次 ，nbr(D = sup(i) e) 迹 代 一 次 ，sup(2) 


第 1 步 用 O(n) 个 处 理 器 ， 执 行 时 间 为 0(1)。2(a) 和 2(b) 步 用 O(n) 个 处 理 器 ， 最 少 需 执行 时 间 
为 O(log n)。2(c) 步 也 需要 O() 个 处 理 器 ， 执 行 时 间 为 O(log n)。 由 于 2(c) 步 重复 执行 [log n] 次 ， 
因而 该 步 共 用 处 理 器 数 为 O(r*)， 执 行 时 间 为 O(log? 六。 

Hirschberg 等 人 (1979) 认 识 到 ， 在 时 间 复 杂 度 没有 提高 的 情形 下 ， 可 以 减少 所 需要 的 处 理 
器 数 ， 从 而 可 以 提高 原始 的 Hirschberg 算法 的 性 能 。 新 算法 所 用 的 处 理 器 数 为 O(n[n/log n])， 
有 时间 为 O(log? n)， 且 执行 SIMD-SM-R 模 型 。 

Chin 等 人 (1981,1982) 考虑 到 迭代 步 仅 仅 用 于 非 孤 立 的 超 点 上 ， 从 而 提高 了 Hirschberg 算 
法 的 性 能 。 这 意味 着 每 一 次 选 代 后 至 少 有 两 个 因素 使 得 起 作用 的 顶点 个 数 减 少 了 。 因 此 ， 用 
O(n[n/log 0]) 个 处 理 器 ， 执 行 时 间 为 O(log? n)， 且 执行 SIMD-SM-R 模 型 。 

Savage 和 Ja Ja (1981) 设计 了 两 个 并 行 连通 度 算法 ， 其 中 一 个 算法 针对 稠密 图 ， 另 一 个 针 
对 稀 朴 图 。Savage 和 Ja Ja 观察 到 ， 执 行 Hirschberg 算法 时 没有 必要 做 [log 可 次 迭代 ， 直 到 连 
续 两 次 迭代 所 得 的 结果 相同 即 可 停止 。 这 时 ， 算 法 运行 的 时 间 是 O(log n * min{log md/2))， 
这 里 d 是 图 的 直径 。 当 d < 2log ?时 (例如 稠密 图 ) ， 算 法 比 原 始 算法 要 快 。 对 于 稠密 图 ， 算 法 
需 处 理 器 数 O(iylog n)， 执 行 时 间 是 O(log n log 中 。 

当 图 是 稀 玻 图 时 ， 通 过 组 织 ， 我 们 输入 相 邻 列表 而 不 是 相 邻 矩阵 ， 这 样 就 减少 了 所 需 的 
处 理 器 数 。 对 Hirschberg 算法 的 重新 组 织 产 生 了 一 个 新 的 算法 ， 该 算法 所 需 的 处 理 器 数 为 
O((m + n)log n)， 执 行 时 间 是 OUog? n)， 这 里 m 是 图 的 边 数 。 

Nath 和 Maheshwari (1982) 在 一 个 比较 弱 的 模型 上 考虑 求 连通 支 问 题 ， 这 个 模型 不 允许 不 
同 的 处 理 器 对 同一 内 存 位 置 执行 并 发 读 操 作 。 他 们 的 算法 是 根据 Hirschberg 等 人 (1979) 的 算法 ， 
通过 将 中 间 的 数据 结构 组 成 一 个 链 ， 并 且 保持 多 份 数 据 拷 贝 ， 从 而 避免 了 上 述 冲 突 。 这 个 算 
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法 用 n 个 处 理 器 ， 执 行 时 间 为 O(log? n)， 且 执行 SIMD-SM 模 型 。 

Shiloach 和 Vishkin (1982) 考 虑 了 一 个 较 强 的 模型 SIMD-SM-RW。 他 们 将 每 个 无 向 边 看 作 两 
个 有 向 边 ， 将 每 个 顶点 和 每 个 有 向 边 放 到 一 个 处 理 器 上 。 与 Hirschberg 算 法 相反 ， 不 再 要 求 通 
过 最 低 标号 顶点 来 判断 连通 支 。 这 个 算法 利用 比较 强 的 模型 ， 不 再 将 最 小 标号 邻 根 连 接 起 来 ， 
让 顶点 尝试 同时 “ 挂 钧 ”(hooking )。 这 使 得 两 个 log? "因子 中 的 一 个 被 log mn 代 替 。 重 新 组 织 使 
得 在 每 次 迭代 中 对 于 路 的 比较 步 仅 用 两 次 ， 而 不 是 log mn 次 ， 这 样 另 一 个 log: "也 被 log n 代 赫 。 

Awerbuch 和 Shiloach (1983) 根据 Shiloach 和 Vishkin (1982) 的 结果 得 到 了 利用 2m 个 处 理 器 ， 
执行 时 间 为 O(log 0) 且 执行 SIMD-SM-RW 模 型 的 改进 型 连通 支 算法 。Wyllie (1979) 利 用 顶点 收 
缩 得 到 了 利用 O(n + 2mm) 个 处 理 器 ， 时 间 为 O(log 门 且 执 行 同步 MIMD-TC-R 模 型 的 算法 。 稀 琉 
图 是 非常 有 效 的 算法 。 通 过 把 与 xz 关联 的 任 一 条 边 变 成 与 ?关联 的 边 ， 使 顶点 xz 收缩 到 顶点 y。 
每 条 边 被 看 作 两 个 有 向 边 ， 输 入 为 相 邻 列表 和 矩阵， 和 且 在 O(1) 时 间 内 完成 转换 ， 这 样 每 个 顶点 
都 有 一 个 有 表 头 的 循环 双向 链表 。 列 表 由 两 部 分 元 素 组 成 : 有 向 边 和 哑 元 。 边 元 素 至 少 被 一 
个 旺 元 分 开 。 这 一 有 向 元 素 结构 允许 两 个 顶点 有 效 收缩 成 一 个 顶点 ， 哑 元 的 使 用 允许 不 同 顶 
点 的 同时 收缩 。 


6.3 2- 连 通 支 


对 于 连通 图 G 的 顶点 v， 如 果 G-v 是 不 连通 的 ， 则 称 v 为 G 的 断 点 (articulation point)。 如 果 
一 个 图 没有 断 点 ， 则 称 为 2- 连 通 图 。 图 6-8a 是 2- 连 通 图 ; 而 图 6-8b 不 是 2- 连 通 图 ， 因 为 5 是 一 
个 断 点 (4 是 另 一 个 断 点 )。 一 个 极 大 诱导 2- 连 通 子 图 称 为 图 的 2- 连 通 支 。 图 6-8b 有 三 个 2- 连 通 
支 ， 如 图 6-8c 所 示 。 检 验 一 个 图 的 2- 连 通 度 是 一 个 有 趣 而 简单 的 问题 。 对 于 每 一 个 顶点 v， 利 
用 连通 支 算 法 ， 需 要 验证 G-v 是 否 是 连通 的 。 对 每 一 个 顶点 v， 如 果 结 果 是 正 的 ， 则 该 图 是 2- 


1 1 
3 2 人 > 
4 4 
5 
a) 5 
9 7 一 人 人 
b) 6 7 


5C) 


图 6-8 
a) 2- 连 通 图 b) 非 双 连通 图 c) 图 6-8b 中 的 2- 连 通 支 


hb> 
2 
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202 BEGIN 
For every v €E V do in parallel 
if G-v is connected 
BCC(v)=0 
else 
BCC(v)= 1 
endif 
end parallel 
BCC(O) = $s BCCO) 
If BCC(G) = 0, then G is biconnected, otherwise not biconnected 


END 
为 了 检验 G-v 的 连通 度 ， 我 们 可 以 利用 前 一 节 描 述 的 CC-VC 算 法 ， 完 整 的 算法 如 下 : 
算法 BCC 


输入 : 相 邻 矩阵 A[i:n, i:n] 
输出 : 布尔 值 BCC。 如 果 G 是 2- 连 通 图 ，BCC = TRUE; 反之 , BCC = FALSE 
BEGIN 
1.Fori= 1 ton do in parallel 
1(a) Construct A,{ 1:n—1, 1l:n—1] from A by deleting the ith row and the ith column 
1(b) Using CC-VC algorithm verify whether A, represents a connected graph 
1(c) If it represents a connected graph assign B(i)= 0 
else 
B(i)=1 
End if 
End Parallel 
2. $= >》 ,BO 
3.IfS= 0 then BCC = TRUE 
else 
BCC = FALSE 
End if 
END 
203 复杂 度 分 析 ”第 1 步 需 处 理 器 数 O(n")， 执 行 时 间 为 0(1); 用 CC-VC 算 法 来 验证 连通 度 需 
On) 个 处 理 器 且 执 行 时 间 为 O(log? n)。 第 1 步 对 n 个 顶点 并 行 执 行 ， 因 此 第 1 步 共 需 O(n”) 个 处 理 
器 且 执 行 时 间 为 O(log* n)。 第 2 步 共 需 0(n) 个 处 理 器 ， 执 行 时 间 为 O(log n)。 因 此 算法 BCC 共 
需 处 理 器 O(n)， 执 行 时 间 为 O(log? n)。 改 进 后 的 算法 可 以 用 来 求 图 的 所 有 2- 连 通 支 。 


6.4 支撑 树 


支撑 树 在 实际 应 用 中 非常 有 用 。 例 如 通讯 网 络 ， 运 和 输 模型 等 。 我 们 用 顶点 来 表示 城市 ， 
用 边 来 表示 连接 城市 之 间 的 交通 路 线 ， 支 撑 树 在 这 个 问题 的 研究 中 非常 有 用 。 当 给 边 赋 权 后 ， 
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有 极 小 总 权重 的 图 的 支撑 树 非常 有 用 ， 这 样 的 支撑 树 称 为 图 的 最 小 成 本 支撑 树 。 

本 节 我 们 求 加 权 图 的 最 小 成 本 支撑 树 问 题 。 下 面 给 出 三 种 方法 来 求 一 个 连通 简单 加 权 图 
的 最 小 成 本 支撑 树 。 

1. Prim 方 法 ; 

2.Kruskal 方 法 ; 

3. Sollin 方 法 。 

在 Prim 方 法 中 ， 支 撑 树 的 构造 是 从 单一 点 出 发 ， 同 时 挑选 一 点 并 把 它 放 到 支撑 树 中 ， 使 
得 总 权重 最 小 。Kruskal 方 法 是 对 边 进行 逐个 挑选 使 得 总 成 本 最 小 。 本 节 我 们 学 习 Sollin 算 法 。 

Sollin 算 法 一 个 图 用 二 维 数 组 COST 描 述 为 


边 (uwv) 的 权重 ， 如 果 (u,v) 是 一 条 边 
COST(u,v)= 4 %m， 如 果 u =v 


%， 如 果 (u,v) 不 是 一 条 边 


Sollin 算 法 将 给 定 图 的 所 有 顶点 看 作 孤 立 点 ， 因 此 ， 图 的 n 个 顶点 被 看 作 n 个 树 ， 每 一 个 树 
只 有 一 个 顶点 > 记 这 12 个 树 为 了， 了 720……， Too 它们 组 成 一 片 森林 
Fo = {To, Ts, To} 


对 于 每 一 个 树 ， 我 们 选取 最 小 成 本 边 (x, v)， 使 得 对 于 不 同 的 i 和 和， 有 u E To，v E Tn。 当 
把 这 些 挑选 出 来 的 边 连 成 树 时 ， 可 以 得 到 ， 在 下 一 次 选 代 中 至 多 有 一 半数 目的 树 。 

一 般 地 ， 在 第 ;次 返 代 中 ， 

F,= {T,, Te 

对 于 每 一 个 树 T,， 我 们 必须 选择 最 小 成 本 边 (u, v)， 使 得 对 不 同 的 K 痒 上 W 有 u E Ts,v E Ti。 
利用 这 条 边 连 接 树 T。 和 T;， 得 到 的 森林 记 为 ,,。 由 上 知 森 林 F, 至 多 含有 一 半数 目的 中 的 树 。 
在 某 次 迭代 中 ， 如 果 只 得 到 一 个 树 ， 就 停止 这 个 过 程 ， 这 个 树 就 是 最 小 成 本 支撑 树 。 由 于 树 
的 数 自 在 每 一 次 迭代 中 依次 减 半 ， 因 此 不 到 log n 次 迭代 我 们 就 可 以 得 到 最 小 成 本 支撑 树 。 利 
用 Sollin 方 法 的 并 行 算法 如 下 : 

算法 Sollin 

输入 : 用 成 本 数组 COST(u,v) 表 示 的 图 G = (V, 局， 这 里 x,v EV 

输出 : G 的 最 小 成 本 支撑 树 

BEGIN 
Fo=(V, T) 
i=0 
While there is more than one tree in F, do 
For each tree T, in forest 已 do ip Parallel 
Choose the minimum weight edge (u, v) joining some vertex u in T; to a vertex » in 


some other tree 也 in forest F. 

Form the forest F,,, by joining all T, and T, of 已 with the corresponding selected edges: 
i=i+!] 

End Parallel 

End While 


on 
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上 面 的 算法 并 不 完整 ， 它 需要 我 们 解释 第 4 ~ 6 步 是 如 何 并 行 执 行 的 。Savage 和 Ja Ja(1981) 
给 出 了 下 面 的 技术 : 森林 F 中 有 几 个 树 ， 树 用 它 的 双亲 关系 表示 ， 用 另 一 个 数据 结构 NEAR(n) 
表示 最 靠近 4 的 另 一 个 树 的 顶点 ， 数 据 结构 ROOT 则 给 出 这 个 树 的 树 根 。 并 行 执 行 如 下 : 

算法 Sollin-1 

输入 : 由 加 权 和 矩阵 Wlu,v) 表 示 的 加 权 图 G = (V,E) 

输出 : G 的 最 小 成 本 支撑 树 

BEGIN 
. For each u E V do in parzllel 
.ROOT() =i 
End parallel 


De 


Over = False 
While not (over) do 
For each u E V do in parallel 
NEAR(u) = v such that ROOT(u) different from ROOT(y) and W(u, rv) = Min 
{Wu w/w ET 
8. End parallel 
9. For each component k of the forest F. do in parallel 
10. Choose a vertex u such that W(u, NEAR(u)) is minimum overall vertices of 大 
11. End parallel 
12. Combine the new edges and create the new forest 天 
13. For each vertex u E V do in parallel 
14. Search ROOT(&) 
15. If ROOT(u) = ROOT(v) for all u, v E V then over = true 
16. End Parallel : 
17. End while 
END 
第 1 ~ 3 步 是 简单 操作 ， 可 用 O(n) 个 处 理 器 在 O(1) 时 间 内 完成 。 下 一 步 迄 代 中 的 森林 Fi,, 至 
多 含有 一 半数 目的 F 中 的 树 ， 因 此 ， 第 5 ~ 17 步 的 循环 共 执 行 log nn 次。 第 7 步 选 择 最 近 的 市 点 ， 
利用 合适 的 数据 结构 ， 并 保留 按 权重 降序 排列 的 边 。 运 用 二 分 搜索 技术 ， 第 7 步 执行 时 间 为 
O(log n)。 第 6 ~ 8 步 是 并 行 循环 ， 用 O(n) 个 处 理 器 且 执 行 时 间 为 O(log n)。 第 9 ~ 11 步 是 并 行 循 
环 ， 第 10 步 用 O(n) 个 处 理 器 且 执 行 时 间 为 O(log n)。 类 似 地 ， 第 12 ~ 16 步 是 并 行 循 环 ， 第 14 ~ 
15 步 用 Ja Ja 给 出 的 数据 结构 共 需 处 理 器 数 为 O(n)， 执 行 时 间 为 O(og? n)。 因 此 Sollin 算 法 共和 需 
O(m) 个 处 理 器 ， 并 行 执行 时 间 为 O(log? n)。 执 行 的 PRAM 模 型 是 CREW， 
6.5 最 短路 问题 
考虑 加 权 有 向 图 G = (V,E)， 每 一 条 边 对 应 一 个 非 负 权重 ， 边 (i, 妃 的 权重 记 为 ww。 假 定 对 
所 有 的 FE V, w = 0。 如 果 (ij) 不 是 一 条 边 ， 定 义 w = %。 路 的 长 度 是 指 这 条 路 中 所 有 边 的 权重 


和 。 顶 点 i 到 j 的 最 短路 是 指 从 i 到 j 具 有 最 小 长 度 的 路 。 最 短路 用 路 的 长 度 和 沿 着 这 条 路 的 顶点 
的 有 序 集合 (或 边 的 有 序 集 合 ) 表示 。 所 有 顶点 对 的 最 短路 问题 是 指 求 每 个 有 序 对 (i, 有 ) 间 的 
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最 短路 问题 。 下 面 的 数据 结构 用 来 设计 一 个 算法 ， 该 算法 用 于 求 所 有 顶点 对 的 最 短路 问题 。 


定义 dj 表示 i 到 的 最 短路 ; 
P, 表 示 i 到 j 的 最 短路 中 j 的 祖先 。 


尖 虑 图 6-9， 它 可 以 用 下 面 的 加 权 人 矩阵 (w ) 来 表示 : 





b 5 c 5 


20 


图 6-9 ”加 权 图 
任意 两 个 顶点 间 的 最 短路 用 下 面 的 矩阵 表示 : 








d a b cc dad 
a 0 14 9 14 
b 14 0 3 10 
c 9 3 0 5 
d 14 10 5 0 
e 5 9 4 9 
fF | 1 15 10 15 


e 


5 
9 
4 
9 
0 
6 


由 于 这 个 例子 对 应 的 图 是 无 向 图 ， 因 而 得 到 的 矩阵 是 对 称 的 。 所 有 路 列表 如 下 : 


Path (a,b)=aecbh 
Path (ac)=aec 
Path (a,d}=aecd 
Path (a,e)=ae 


Lee 
| 
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Path (af}=aef 

Path (b,c)=bec 

Path (b,d)=bcd 

Path (b,e)=bce 

Path (bf/) =bcef 

Path (c,d) = cd 

Path (c,e}=ce 

Path (cf)=cef 

Path (de)=dce 

Path (df)=dcef 

Path (ef =ef 

从 上 面 的 路 中 我 们 可 以 求 每 一 顶点 对 (i, 有 ) 的 值 P,。 上 面 的 数据 结构 可 有 效 地 用 于 下 面 的 
Floyd Warshall 算 法 中 。 首 先 ， 我 们 有 : 

wi, (IDDEE 
dy =1%, (LN) EE 
0, i=j 
Py = i， 对 所 有 的 i 和 

上 面 的 初始 化 意味 着 首先 要 考虑 有 向 距离 。 现 在 来 比较 d; 与 从 i 到 中 间 点 k 的 距离 和 从 Kk 到 ] 
的 距离 之 和 的 值 ， 如 果 d; 较 大 ， 取 经 过 k 的 路 。 上 面 的 更 新 结果 可 以 通过 选取 每 一 个 顶点 k 来 
修正 。Floyd-Warshall 算 法 如 下 : 

算法 Floyd-Warshall 

输入 : 由 加 权 和 矩阵 (Wi) 表 示 的 图 

输出 : 矩阵 (dy) 和 (P，) 

BEGIN 
. For i = 1 to n do in parallel 


[ma 


For j= 1 to n do in parallel 
dj = Ws 
P,=i 
End parallel 
End parallel 
Fork=1tondo 
For each pair (i,j) where0 < i,j<nandi,jzkdo in parallel 
.If d; > di + dy then 
dj;= di + dy 
P,= Py 
endif 
10. End parallel 
11. End for 


Cm moD 
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12. Output p and d matrices. 
END 


上 面 算法 执行 CREW PRAM 模 型 ， 共 需 处 理 器 数 为 O(n*)， 执 行 时 间 为 0(n)。Gayraud 和 
Authir(1991) 又 建议 了 另 一 个 并 行 实现 的 算法 ， 使 用 P 个 处 理 器 且 执 行 时 间 为 O(n3p+np)。 在 他 
们 的 算 革 中， 考虑 了 面向 行 的 技术 。 在 第 k 步 从 代 中 ， 和 矩阵 (d;) 和 (pi) 的 第 ; 行 的 更 新 由 单独 的 
过 程 LMOD(i, 有 给 出 。 第 7 ~ 11 步 为 

BEGIN 

7.Fork=1tondo 
8. Fori= 1 ton (iz#k) do in parallel 
9. LMOD(i, Rh) 
10. End parallel 
11. End for 
END 


过 程 LMOD 如 下 : 
过 程 LMOD(i,k) 
BEGIN 
Forj= 1 ton,j)=iandj=kdo in parallel 
if d; > dy then 
dj;= di + dy 
Ps= Ps 
end if 
End Parallel 
END 
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习题 


6.1 


6.2 


6.3 


6.4 


6.5 


6.6 


6.7 


拓扑 排序 定义 如 下 : 给 定 一 个 含 n 个 顶点 的 有 向 无 圈 图 G = (V,E)， 给 每 个 顶点 v 标 上 

记号 1，1 E {1,2,…,n}， 使 得 只 要 (uwv) E E， 就 有 i(u) < Lv)。 设 计 一 个 并 行 算法 对 图 

G 执 行 拓 扩 排序 。 

连通 图 G6 的 迹 是 指 序列 W = {e; = (wyDes = (Vv2)… er = (Visv)}， 所 有 的 边 都 不 同 。 

欧 拉 迹 遍 历 G 的 每 条 边 。 设 计 一 个 算法 求 图 C 的 欧 拉 迹 。 

G = (V,E) 是 一 个 二 部 图 ， 最 大 的 度 是 A= 2，/ 是 正 整数 。 

a. 如 何 将 G 分 成 两 个 二 部 图 G, 和 G,， 其 中 每 个 最 大 度 都 是 A/2。 算 法 所 用 的 时 间 为 
OUog 由， 所 用 操作 数 为 OUEI+IVD; 

b. G 的 k- 边 染色 是 指 从 颜色 和 集 {1,2,… 慷 } 中 选 出 颜色 给 每 条 边 分 配 颜 色 、 使 得 只 要 e 和 
g 有 公共 顶点 ， 就 有 c(e)z* clg)。 利 用 (a) 中 算法 求 G 的 A- 边 染色 。 

G = (V,E) 是 一 无 向 图 且 用 它 的 相 邻 列表 表示 。 欧 拉 划 分 是 指 将 E 分 成 边 不 相交 的 路 

(包括 圈 ) {P,}， 使 得 每 个 奇数 度 的 顶点 恰 是 一 条 路 (有 两 个 不 同 端点 ) 的 端点 ， 同 

时 偶数 度 的 顶点 不 能 成 为 这 样 一 条 路 的 端点 。 如 何在 O(log nn) 时 间 内 利用 线性 数目 的 

操作 得 到 一 个 欧 拉 划 分 。 提 示 : 从 欧 拉 图 人 手 。 

假设 给 定 了 一 个 无 向 图 G = (V, 忆 及 一 个 向 量 D， 使 得 D(u) = D(Y)， 当 且 仅 当 wuwv 在 同 

一 个 连通 支 中 。 设 计 一 个 有 效 的 并 行 算法 来 确定 连通 支 数 :， 并 在 每 个 连通 支 中 生成 

一 个 独立 的 顶点 列表 。 

已 知 有 3 种 不 同 的 方法 来 描述 图 G = (V,E): 相 邻 拭 阵 ， 相 邻 列表 集合 ， 边 的 无 序 集合 。 

设计 一 个 并 行 算法 将 一 种 表示 转变 成 另 一 种 表示 ，、 所 用 时 间 为 O(log 内， 这 里 IW = n。 

每 一 种 情形 中 总 的 操作 数 是 多 少 ? 

给 定 一 个 含 # 个 顶点 的 无 向 连通 图 G。 设 计 一 个 算法 来 求 G 的 所 有 支撑 树 ， 所 用 的 时 

间 为 O(log n)， 所 用 的 总 操作 数 是 O((ntm)log n)， 这 里 m 指 边 的 个 数 。 假 定 输入 的 是 

边 的 序列 。 不 允许 用 优先 CRCW PRAM 模 型 。 
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6.8 对 于 无 向 图 G = (V,E)， 如 果 存 在 V 的 一 个 划分 VY = V, UV;， 使 得 每 条 边 有 一 个 端点 在 
V 中 ， 另 一 个 端点 在 上 中 ， 则 G 称 为 二 部 图 。 设 计 一 个 算法 求 这 样 一 个 二 部 图 ， 所 用 
时 间 为 O(log nn)。 
提示 : 从 求 G 的 支撑 树 出 发 。 

6.9 对 于 连通 无 向 图 G = (V,E) 的 菜 个 顶点 v， 如 果 去 掉 顶 点 v，G 就 不 连通 了 ， 称 Yy 为 断 点 。 
a. 证 明 : v 是 断 点 当 且 仅 当 它 属 于 不 止 一 个 块 。 

b. 设计 一 个 有 效 的 并 行 算 法 求 C 的 所 有 断 点 。 

6.10 假定 G = (V,5) 是 一 个 连通 图 ， 对 于 G 的 某 条 边 e， 如 果 去 掉 这 条 边 G 就 不 连通 了 ， 则 
称 e 为 桥 。 设 计 一 个 并 行 算法 求 G 的 所 有 的 桥 。 算 法 的 复杂 度 应 与 其 中 一 个 连通 支 算 
法 的 复杂 度 匹 配 。 
提示 : 从 求 G 的 支撑 树 出 发 。 





第 7 章 弦 图 的 NC 算 法 


如 果 并 行 算法 的 时 间 复 杂 度 是 O(log* n)， 并 且 所 用 的 处 理 器 数 是 n 的 多 项 式 ， 这 里 n 是 输入 
的 大 小 ，k 是 常数 ， 则 该 算法 属于 NC 类 型 。 本 章 我 们 研究 纺 图 的 NC 算法 。 蓄 图 在 数据 结构 的 
分 类 中 担当 重要 角色 。 如 果 输 入 的 图 是 弦 图 ， 一 些 NP 完 全 问题 可 在 线性 时 间 内 解决 。 我 们 在 
第 2 章 已 经 介绍 了 弦 图 ， 弱 图 是 完美 图 的 一 个 重要 的 子 类 。 这 里 完美 图 是 指 这 样 一 种 图 ， 它 的 
最 大 团 的 大 小 等 于 图 的 色 数 。 苹 图 在 许多 领域 都 有 应 用 ， 其 中 包括 高 斯 消 元 法 、 数 据 库 等 。 
首先 列 出 弦 图 的 一 个 性 质 。 

定理 7-1 图 G =(V,E) 是 蓄 图 ， 当 且 仅 当 G 的 每 一 个 极 小 分 离 集 导出 G 的 一 个 团 。 

证 明 : 设 u, ?是 弦 图 G = (V,E) 的 两 个 不 相 邻 的 顶点 ，5 记 为 u,v 的 极 小 分 离 集 ， 如 果 5 仅 含 
有 一 个 顶点 ， 则 $ 导 出 一 个 田 ; 否则 ， 假 定 x, y 是 $ 中 不 相 邻 的 顶点 。 由 于 5 是 极 小 4, v 分 离 集 ， 
u,v, x, y 是 不 含 纺 的 圈 的 四 个 顶点 。 这 与 G6 是 粥 图 韦 盾 ， 因 此 5 的 每 一 对 顶点 都 相 邻 。5 导 出 一 
个 团 。 

反 过 来 ,假定 每 一 个 极 小 分 离 集 都 是 一 个 团 。 设 vwv,… viv 是 无 强 的 圈 ，v, 和 vs 是 两 个 不 
相 邻 的 顶点 ， 其 极 小 分 离 集 包含 v 以 及 顶点 vowv;… ,vi 中 至 少 一 个 顶点 。 也 就 是 说 ， 极 小 分 离 
集 含 有 顶点 v, 和 v;,， 这 里 4< i<k。 但 是 v, 和 vw 是 不 相 令 的， 因此 极 小 分 离 集 不 能 导出 一 个 团 。 
这 与 假设 矛盾 。 


7.1 区 图 判别 


为 了 设计 判别 续 图 的 算法 ,我们 引入 几 个 记号 : 如 果 x 和 "* 是 图 G 的 两 个 不 相 邻 的 顶点 ， 记 
G, = G-adj(u). 

C= G, 中 包含 v 的 分 支 ; 

M,, = {x:x EE adj(u)X 与 C。 中 的 某 些 顶 点 相 邻 }。 

考虑 图 7-1a 所 示 的 图 ， 图 7-lb 表 示 G,， 图 7-1c 表 示 包 含 顶点 "的 G. 的 分 支 Cu。 

Ms。 表示 与 C。 eA, 在 图 7-1a 中 ，M,, = {6,3}。M,, 是 极 小 u-v 分 
离 集 。 我 们 证 明 如 下 结 

定理 7-2 国人 当 且 仅 当 对 于 每 一 对 不 相 邹 的 顶点 w 和 Vv，M 是 团 。 

证 明 : 在 证 明 结论 之 前 ， 首 先 证 明 M, 是 u-v 分 离 集 ， 并 且 证 明 如 果 M 含 有 一 对 不 相 邻 的 
顶点 ， 则 G 含 有 一 个 长 度 至 少 为 4 的 无 续 圈 。 很 明显 ，G-M。-{w} 包 含 C,,， 任 一 个 在 G-M。-{u} 
中 而 不 在 C。 中 的 顶点 x 与 C 中 的 顶点 不 相 邻 。M, 分 离 x 和 C 中 的 所 有 顶点 。 特 别 地 ，M 是 G 
的 zy 分 离 集 。 现 在 证 明 如 果 M.. 含 有 一 对 不 相 邻 的 顶点 ， 则 G 含 有 一 个 长 度 至 少 为 4 的 无 弦 圈 。 

假定 x 和 y 是 MM 中 两 个 不 相 邻 的 顶点 ，x 和 y 分 别 与 Cs 中 顶点 r 和 s 相 邻 。 假 定 raiazas…aps 是 
C, 中 的 最 短 的 无 闭路 ， 则 wxraiaxa…asyu 是 G 中 长 度 至 少 为 4 的 无 弦 圈 。 

现在 我 们 来 证 明定 理 7-2。 设 C 是 弦 图 且 包 含 不 止 一 个 团 。 假 定 M.. 不 是 团 ， 则 它 包 含 一 对 
不 相 邻 的 顶点 ， 因 此 由 前 面 的 讨论 知 G 包 含 一 个 长 度 至 少 为 4 的 无 弦 圈 。 这 与 G 是 弦 图 矛盾 。 
因此 MM 是 团 。 
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a) b) 


c) 


图 7-1 
a) 图 G b) 图 C.，c) C= 包含 "的 G. 的 分 支 

反 过 来 ， 假 定 对 于 每 一 对 不 相 邻 的 顶点 4y，M., 是 团 ， 并 假定 G 不 是 荡 图 ， 则 存在 一 个 无 
营 围 ww， 令 &= my = 六， 则 M 包 含 {wy 少 ， 且 M. 不 是 一 个 团 。 这 与 对 于 任何 一 对 
不 相 邻 顶点 u, v，M. 是 团 相 矛盾。 因此 G 是 弥 图 。 

为 了 检验 一 个 图 是 否 是 弦 图 ， 对 于 每 一 对 不 相 邻 的 预 点 4, v， 我 们 只 要 检验 M.. 是 否 是 一 
个 团 。 如 果 对 于 每 一 对 不 相 邻 的 G 的 顶点 4, v，M 刚 好 是 一 个 团 ， 我 们 可 以 得 出 结论 ，G 是 弦 
图 。 和 否则 C 不 是 弦 图 。Iyengar(1985) 给 出 了 下 面 完 整 的 算法 。 

算法 Chordal Test 一 Chandra & lyengar 

输入 : 图 G 

输出 : C 是 否 为 弦 图 





iD 
oa 





BEGIN 
1. If G is a clique then output that G is chordal and terminate 
2. For every pair of non adjacent vertices u, v do in Parallel 
2a. H= G-ADJ(u) 
2b.C = Component of H containing v 
2c.M=® 
2d. For each x € ADJ(u) and y € H do in parallel 
If (x,y) EEthen M= MU {x} 
End parallel 
2e.1f Misaclique return CHORDAL = 1 
. End parallel 


.If for each pair of non adjacent vertices the value returned is 1 then 
output that G is chordal 
else 
output that G is not chordal 
end if 
END 


Vv 的 不 相 邻 的 顶点 对 的 个 数 是 O(n)。 为 了 找 出 连通 支 ， 我 们 利用 第 6 章 给 出 的 算法 ， 该 算 
法 共 需 处 理 器 数 为 O(m)， 执 行 时 间 为 O(log n)。 第 2d 步 需要 处 理 器 数 为 0(m?)。 因 此 这 个 算法 
共 需 处 理 器 数 为 O(n'”)， 执 行 时 间 为 O(log n)。PRAM 模 型 应 用 CREW。 这 个 用 来 判别 苞 图 的 方 
法 也 用 来 判别 图 的 一 类 有 趣 的 子 类 : 大 树 。 
k- 树 k- 树 是 弦 图 一 类 非常 重要 的 子 类 ， 下 面 给 出 定义 和 它 的 一 些 性 质 。 
定义 : 如 果 一 个 图 可 由 下 面 的 递归 构造 得 到 ， 则 称 为 玉树 。 
1. 从 k 个 元 素 组 成 的 团 作为 一 个 基本 图 出 发 ， 这 Kk 个 元 素 的 团 就 是 k- 树 。 
2. 对 于 任 一 - 树 矿 ， 增 加 一 个 新 的 顶点 ， 并 使 得 它 与 吾 中 的 一 个 团 的 所 有 顶点 相 邻 ， 而 构 
成 一 个 含 k+1 个 元 素 的 团 。 
下 面 我 们 给 出 k- 树 的 特征 定理 。 
定理 7-3 下 面 的 叙述 是 等 价 的 : 
1.G = (V,E) 是 k- 树 ; 
2. (a) G 是 连通 的 ; 
(b) GC 含 有 一 个 K 团 ， 但 不 含有 (K+2) 团 ; 
(Cc) 每 一 个 极 小 顶点 分 离 集 是 一 个 k 团 。 
3. (a) G 是 一 个 弦 图 ; 
(b) IE| = KIVI—K(k+1)/2; 
(Cc) G 含 有 一 个 k 团 ， 但 不 含有 (Kk+2) 团 。 
4. (a) G 是 连通 的 ; 
(b) LEI = KIVI-K(k+1)/2; 
(c) 每 一 个 极 小 顶点 分 离 集 是 一 个 Kk 团 。 
上 面 定 理 的 证 明 留 给 读者 自己 完成 。 
Chandra 和 lyengar 的 k- 树 判别 算法 ”判定 志 树 的 NC 算 法 类 似 于 判定 弦 图 的 NC 算 法 ， 但 不 
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同 的 是 ， 它 利用 极 小 分 离 集 。 我 们 需要 下 面 的 基本 结论 。 

定理 7-4  G 是 一 个 不 完全 的 统 图 ，x 是 G 中 一 个 单纯 点 (simplicial vertex), H = (U,F) = 
G-{zt， 则 对 于 刀 中 任何 一 对 不 相 邻 的 顶点 YY， 不 存在 包含 x 的 极 小 by 分 离 集 。 

证 明 : 如 果 太 是 一 个 团 ， 则 定理 显然 成 立 。 现 在 假定 不 是 一 个 团 ，u 和 v 是 两 个 不 相 邻 的 
顶点 ，x 和 "不 可 能 都 与 * 相 邻 ， 否 则 ，x 和 必定 相 邻 。 因 而 ，x 和 "中 至 多 有 一 个 顶点 与 * 相 邻 。 
分 两 种 情形 讨论 。 

情形 1 

不 失 一 般 性 ， 假 定 x 与 zx 相 邻 ，* 与 x 不 相 邻 ，$ 是 包含 在 {z}y U adj(x)-{ 中 } 中 的 极 小 wu-v 分 离 
集 。C 和 C; 是 分 别 包 含 4 和 vy 的 G-5 的 连通 支 ， 则 C, mn C: = @。 因 为 x 是 一 个 单纯 点 ， 故 C; 中 没 
有 顶点 与 x 相 邻 ， 从 而 C: 中 也 没有 顶点 与 x& 相 邻 ， 这 是 因为 如 果 C: 中 有 一 顶点 z 与 4 相 邻 ， 并 且 也 
有 z 与 zx 不 相 邻 ， 则 在 G-S$ 中 zx 和 v* 将 有 一 条 路 相连 。 但 是 我 们 已 经 知道 C: 中 没有 顶点 与 < 相 邻 ， 
因此 C: 中 的 所 有 顶点 都 与 adj{fx}y-{o 的 一 个 子 集 相 邻 。 因 而 x 和 v 将 被 R = (adj(z-{Tzy) 站 
. adj(C;) 分 离 。 更 进一步 ， 很 容易 看 出 R 也 是 惟一 的 一 个 包含 在 adj{x} U {=-{N 中 的 极 小 zy 分 
离 集 。 如 果 极 小 4-v 分 离 集 S 包 含 ， 则 它 必定 是 adj(x) U {x}-{w} 的 子 集 ， 但 是 我 们 知道 在 
adj(x) U {xX} 一 {} 中 惟一 的 极 小 u-v 分 离 集 是 R 而 其 并 不 包含 [。 因 而 定理 成 立 。 

情形 2 

& 和 v 都 不 与 x 相 邻 ，$ 是 包含 在 adj{z}y U {x} 中 的 极 小 u-v 分 离 集 ，C, 和 Cs 是 分 别 包 含 4 和 ?的 
连通 支 ， 又 因为 在 Cl 或 C, 中 没有 顶点 与 x 相 邻 ， 因 此 包含 在 adj{x} U {x} 中 的 极 小 4-v 分 离 集 
adj(x) m adj(C) 和 adj(x) m adj(C;)， 它 们 都 不 含有 x， 由 前 面 的 情形 我 们 知道 定理 成 并 。 

下 面 我 们 给 出 关于 k- 树 的 新 的 特征 。 

定理 7-5 图 G = (V,E) 是 Kk- 树 当 且 仅 当 

a: 对 于 G 的 每 一 对 不 相 邻 的 顶点 wu 和 vv， 存在 一 个 极 小 U-v 分 离 集 ， 其 中 这 个 极 小 u-v 分 离 集 

是 一 个 K 团 ; 

b: m = kn—k(k+1)/2。 

证 明 : (必要 性 ) 如 果 G 是 一 个 团 ， 则 它 是 太 树 。 如 果 G 不 是 一 个 团 ， 则 对 于 每 一 对 不 相信 
的 顶点 x 和 v，G 的 极 小 分 离 集 是 k 团 、 更 进一步 有 m = kn-k(k+1)/2。 

(充分 性 ) 条 件 a 可 以 导出 G 是 弦 图 ， 因 此 我 们 只 要 证 明 G 有 一 个 上 团 ， 而 不 包含 (f+2) 团 。 
首先 ， 如 果 G 是 一 个 团 ， 则 它 不 可 能 是 (t+2) 团 。 所 以 假定 G 不 是 一 个 困 ， 由 于 G 含 有 一 个 极 小 
分 离 集 ，G 必 含有 一 个 k 团 。 我 们 通过 对 G 的 顶点 数 进行 归纳 证 明 。 所 有 包含 1，2，3 ，4 个 顶 
点 的 图 不 含有 (x+2) 团 。 假 定 顶点 小 于 或 等 于 n-1 的 所 有 的 满足 条 件 a 和 b 的 图 不 含有 团 。 对 含 
有 nn 个 顶点 的 满足 条 件 a 和 b 的 图 进行 讨论 ， 由 于 G 是 荡 图 ， 在 G 中 存在 一 个 单纯 点 x。 令 H = 
(UP = G-{x}，W = {x} U adj(x)。 于 是 IUI = n-1，IWi<n-1， 否 则 ，G 是 一 个 田 。 现 在 考虑 
如 下 两 种 情形 。 

情形 1 

假定 8H 是 (n-1) 团 ，H 满 足 条 件 a 和 b。 由 归纳 假设 ,不 含有 (k+2) 团 ， 由 于 G 不 是 一 个 团 , 在 
U 中 至 少 存在 一 个 顶点 与 x 不 相 爸 ， 更 进一步 ， 所 有 极 小 z-x 分 离 集 只 能 是 adj(x)， 这 里 z F adj(x)。 
由 于 G6 满足 条 件 a，adj(x) 必 定 是 一 个 k 团 ， 由 此 推出 在 G 中 至 少 有 一 个 k 团 ， 而 不 含有 (k+2) 团 。 

情形 2 

H 不 是 一 个 团 ， 在 G 中 ， 对 于 任何 一 对 不 相 邻 的 顶点 w,z EV， 存 在 一 个 极 小 分 离 集 ， 它 是 
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k 团 。 因 为 x 不 可 能 包含 在 任 一 个 极 小 w-z 分 离 集中 ， 所 以 H 满 足 条 件 a。 从 极 大 团 W 开 始 ， 考 虑 
图 G 的 递归 构造 。 假 设 y 是 后 来 被 加 入 到 这 个 递归 构造 过 程 的 顶点 ，y 与 x 不 相 邻 ， 但 与 在 adj(x) 
中 的 一 个 团 相 邻 ,更 进一步 ， 任 何 极 小 x-y 分 离 集 都 包含 在 adj(x) 中 。 如 果 ladj(x)l < k 或 者 ladj(y) 
< 上 ， 则 在 C 中 存在 一 个 顶点 数 小 于 /的 极 小 zy 分 离 集 ， 这 与 假设 矛盾 。 如 果 ladjCol 和 ladjO)l 都 
小 于 Kk， 可 得 到 类 似 的 矛盾 ， 因 而 有 ladj(x)1 = ladjO)l = k。 因 此 ， 厂 有 mk = k(n 一 1)-Kk+1)/2 条 
边 ， 所 以 H 也 满足 条 件 b。 由 归纳 假设 , 石 不 包含 (k+2) 团 。 故 G 也 不 含有 (K+2) 团 。 

下 面 的 串 行 算法 用 来 检测 图 G 是 否 为 上 - 树 ， 算 法 的 内 容 类 似 于 Chordal Test 算法 的 内 容 。 

算法 k-tree Test 一 Chandra and lyengar 

输入 : 2? 个 顶点 和 闫 条 边 的 图 G 

输出 : 图 G 是 否 为 玉树 

BEGIN 

1.Ifthe equation m = kn~k(k+1)/2 does not have a positive integer root < n for k, G is not 

ak tree, Terminate 
End if 
Let k <n be a positive integer root of the above equation 
For every non adjacent unordered pair of vertices u and v of V do 
G, = G-ADJ(u) 
C,, = the component of G, containing vy 
M,, = {x:x €E ADJ(u) and x is adjacent to some vertex in C,, 


wb 


If M.,, induces a k-cliques in C then continue 
else 
G is not ak tree 
terminate 
End if 
8. End for 
9.Gisak tree 
END 


上 面 算法 的 正确 性 由 下 面 定理 来 确保 。 

定理 7-6 图 G 是 k- 树 当 且 仅 当 : 

1.m = kn—k(k+1)/2; 

2. 对 于 图 G 中 所 有 不 相 邻 的 顶点 对 uw 和 v， 算 法 中 的 几时 出 一 个 k 团 。 

证 明 : (充分 性 ) 很 容易 看 出 M 是 G 中 的 一 个 极 小 w-v 分 离 集 ， 更 进一步 ， 定 理 7-5 的 条 件 
被 满足 ， 由 定理 7-5，G 是 大 树 。 

(必要 性 ) 假设 G 是 - 树 ， 则 显然 有 m = kn-k(k+1)/2， 因 此 k 是 满足 上 述 方程 的 正 整 数 解 。 
更 进一步 ，G 不 是 一 个 团 ， 很 容易 证 明 上 述 方程 至 多 有 一 个 小 于 nm 的 正 整数 根 。 现 在 ， 假 定 对 
于 一 对 不 相 邻 的 顶点 4 v，M. 不 是 k 团 ， 那 么 ， 因 为 Mi 是 一 个 极 小 分 离 集 ， 因 此 它 不 是 k- 树 ， 
这 与 假设 矛盾 。 

下 面 的 定理 可 直接 证 明 。 

定理 7-7 算法 k-tree Test 可 正确 检测 图 G 是 否 是 k- 树 。 
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k-tree Test 串 行 算法 可 以 并 行 化 为 NC 算 法 。 我 们 有 下 面 结 论 。 
定理 7-8 存在 检测 k- 树 的 并 行 算法 ， 该 算法 共 需 处 理 器 数 为 O(n')， 执 行 时 间 为 O(log n)。 
Naor,，Naor 和 Schaffer 算 法 ”Naor, Naor 和 Schaffer (1989) 主要 从 事 关 于 叱 图 的 并 行 算法 
研究 ， 并 设计 了 关于 弦 图 的 一 些 NC 算 法 。 我 们 从 他 们 关于 弦 图 的 判别 理论 出 发 。 他 们 算法 的 
主要 优点 在 于 算法 的 正确 性 很 容易 从 弦 图 的 定义 中 得 到 , 即 图 不 含有 长 度 大 于 3 的 诱导 无 弦 圈 。 
另 一 个 优点 是 在 稀疏 图 上 ， 它 利用 渐进 减少 的 处 理 器 。 算 法 中 我 们 将 利用 下 面 一 些 记 号 。 
NG) = 与 " 相 邻 的 顶点 集合 ; 
Gv = V-{v} 的 诱导 图 ，; 
如 果 WWCV ，G-W = V~-W 的 诱导 图 。 
并 行 算法 由 下 面 的 定理 给 出 。 
定理 7-9 ”图 G = (V,E) 不 是 一 个 弦 图 当 且 仅 当 它 含有 一 个 顶点 v， 且 有 具有 下 列 性 质 : (Gv) 
-NO 的 一 个 连通 支 与 NOy) 的 两 个 彼此 不 相 邻 的 项 点 扯 邻 。 
证 明 : 假定 G = (V,E) 是 一 个 图 ， 存 在 一 个 顶点 v 使 得 wi,w; E N(v)，、 并 且 它 们 都 与 (Gv)- 


N(v) 的 一 个 连通 支 相 邻 ，wi,w; 不 相 邻 ( 见 图 7-2)。 设 w,t 是 该 连通 支 的 顶点 ， 且 wi,w; 分 别 与 


ws 相 邻 ，wiwv 和 w; 属 于 一 个 长 度 大 于 3 的 无 荡 圈 ， 因 此 G 不 是 一 个 弦 图 。 


/全 
\7 


N V) 
图 7-2 围 的 形成 


反 过 来 ， 假 定 G 不 是 一 个 弦 图 ，wvw…Ywoy 导 出 一 个 长 度 为 > 4 的 无 弦 围 。 考 虑 顶点 w， 
在 图 (G-v)-NGv) 中 ，wy…Ye 位 于 相同 的 连通 支 上 ，ww 属 于 NO) 并 且 它 们 都 与 (CC~vD- 
Nty0) 的 连通 支 相 邻 ， 该 连通 支 包 含 ww,，…w-:， 而 *% 与 w 不 相 邻 。 因 此 定理 得 证 。 

根据 定理 7-9， 为 了 检验 图 G 是 否 是 弦 图 ， 我 们 可 以 检验 图 G 中 是 否 存在 一 点 请 足 定理 7-9 
的 条 件 。 对 于 每 一 个 顶点 v， 首 先 必须 求 出 (G~v)-N(v) 以 及 它 的 连通 支 。 然 后 对 于 N(Y) 中 每 一 
对 不 相 邻 的 顶点 (u, w)， 检 验 是 否 有 某 个 连通 支 与 4 和 w 都 相 邻 。 如 果 这 样 的 连通 支 存 在 的 话 ， 
我 们 可 以 得 出 结论 ， 即 G 不 是 弦 图 。 并 行 算法 如 下 : 

算法 Chordal Test 一 Naor Naor and Schaffer 

输入 : 简单 无 向 图 G = (V,E) 

输出 : G 是 否 为 弦 图 


iD 
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BEGIN 
1. (a) For each v €E V do in parallel 
(b) Find all the connected components of (G—v)~N(v) and Number them 
(c) End parallel 
2.(a) For every u, w E V do in parallel 
(b) If (4, w) is not an edge but (v, 4u) and (v, w) are edges then select the pair(u, w) 
(c) End parallel 
3. (a) For each v € V do in parallel 
(b) For each u € N(v) do in parallel 
(C) Compute a sorted list of connected components computed in step lb to which u is 
adjacent 
(d) End parallel 
(e) End parallel 
4. (a) For every vertex v EV do in parallel 
(b) For every pair of vertices u, w €E N(v) such that (u, w) is not adjacent do in parallel 
(c) Verify if there is an entry in the list of connected components to which both x and w 
are adjacent. If so, conclude G is not chordal 
(d) End parallel 
(e) End parallel 
5. (a) If step 4c does not declare that C is not chordal for any pair (u, w) and v E€E V then 
conclude that G is chordal 
END 


复杂 度 分 析 第 1 步 可 以 利用 第 6 章 中 的 连通 支 算法 ， 用 CREW PRAM 模 型 ， 需 处 理 器 
O(n?))， 执 行 时 间 为 O(log? n)。 在 第 1 步 中 我 们 对 所 有 nn 个 顶点 并 行 执行 ， 因 此 第 1 步 共 需 处 理 器 
O(m)， 执 行 时 间 为 O(log n)。 第 2 步 的 复杂 度 依赖 于 图 的 数据 结构 ， 如 果 考 虑 到 它 的 相 邻 人 算 阵 ， 
第 2 步 可 表示 如 下 : 

If (A(u, w) = 0 and A(v, u) = 1 and A(v, w) = 1) then select 
the pair (u, w) 
end if 

这 个 过 程 共 需 时 间 为 0(1)。 如 果 一 个 图 用 相 邻 列表 来 表示 ，、 第 2(b) 步 共 需 处 理 器 Olm)， 执 
行 时 间 为 O(log n) (m 指 图 G 中 边 的 个 数 )。 因 此 ， 第 2 步 共 需 处 理 器 数 为 OUmn), 时 间 为 O(log n)。 
第 3(c) 步 用 一 个 处 理 器 ， 所 需 时 间 为 O(log? n);， 第 3(b) ~ (d) 是 并 行 循环 ， 循 环 执行 的 次 数 是 顶 
点 v 的 度数 ， 又 因为 所 有 顶点 的 度 和 为 2m， 因 此 第 3 步 所 需 的 处 理 器 数 为 Olmn)， 执 行 时 间 为 
O(log’ n)。 第 4 步 所 需 的 处 理 器 数 为 Olmm?)， 执 行 时 间 为 O(log n): 每 一 个 三 元 数组 (v,u,w) 使 得 
v 与 4 相 邻 ，w 与 4 彼此 不 相 邻 。 给 第 3 步 中 每 对 (u,w) 得 到 的 连通 支 列表 的 每 一 个 分 支 分 配 一 个 处 
理 器 。 对 所 有 顶点 对 (u, w)， 连 通 支 列表 的 总 的 长 度 为 O(mn)。 对 于 这 个 列表 中 的 每 一 个 元 素 
至 多 分 配 n-2 个 处 理 器 ， 一 个 处 理 器 对 应 w 的 每 次 选取 。 总 的 处 理 器 数 是 O(mn”)。 对 于 三 元 数 
组 (v,u,w)， 与 元 素 C 相 应 的 处 理 器 在 (v,w) 的 分 支 列表 中 对 C 执 行 二 分 搜索 ， 并 把 结果 记录 下 
来 。( 如 果 求 出 C 则 结果 为 1， 否 则 结果 为 0)。 对 于 每 一 个 固定 的 v， 与 含有 "并 把 * 作 为 第 一 个 元 
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素 的 三 元 数组 相应 的 所 有 处 理 器 执行 的 结果 做 布尔 OR 运算 。 由 第 4 步 ， 我 们 得 到 n 个 布尔 值 。 
第 5 步 中 ,我 们 对 这 x 个 布尔 值 执 行 布尔 OR 运算 ， 用 O() 个 处 理 器 ,执行 时 间 为 O(log n)。 央 此 ， 
该 算法 所 用 的 总 的 处 理 器 数 为 OC(mn?)， 执 行 时 间 为 O(log? n)， 且 执行 CREW PRAM 模型 。 

Naor, Naor 和 Schaffer (1980) 对 于 下 列 问 题 也 设计 了 NC 并 行 算法 : 

1. 列 出 弦 图 的 所 有 极 大 团 ; 

2. 求 出 弦 图 的 最 优 染 色 ; 

3. 求 出 弦 图 的 树 表示 ; 

4. 求 出 弦 图 的 最 大 独立 集 ; 

5. 求 出 弦 图 的 最 小 团 和 覆盖。 


7.2 弦 图 的 极 大 团 


首先 让 我 们 来 看 一 个 求 强 图 的 所 有 极 大 团 的 算法 ， 一 个 纺 图 至 多 有 nn 个 极 大 团 。 首 先 定 义 
双 团 (bi-clique)。 

如 果 图 G = (V,E) 的 顶点 集 V 可 以 分 成 两 个 集合 4 和 B， 使 得 由 4 和 8 所 导出 的 图 都 是 团 ， 我 
们 称 G 为 双 团 。 我 们 用 分 而 治之 法 来 求 一 般 弦 图 G 的 所 有 极 大 团 。 如 果 Y 被 分 成 任意 两 个 大 小 
几乎 相等 的 不 相交 的 子 集 ， 可 递归 地 计算 由 4 和 8B 导出 的 图 的 极 大 团 ， 于 是 对 G4 和 Gs 的 每 一 对 
极 大 团 p 诱 导 子 图 G4 的 双 团 。 有 上 面 讨论 可 知 ， 用 来 求 极 大 团 的 算法 也 用 来 计算 双 团 的 所 有 
极 大 团 。 

对 于 弦 图 G =(V,E)， 我 们 感 兴趣 的 是 计算 所 有 的 极 大 团 。V = A U B 是 图 G 的 顶点 的 一 个 
划分 ， 满 足 I4I 和 1BI 几 乎 相等 。P 和 Q 分 别 是 Gs 和 Gs 的 极 
大 团 ， 这 里 G4 表示 由 A 导出 的 图 ，P U Q 生 成 一 个 双 团 
记 为 Gmo。 对 于 任 一 顶点 v € P， 记 No(v) = {wEQ:(vw) 
是 PUO 中 的 一 条 边 }。 同 样 地 ， 对 于 任意 顶点 vEQ， 记 
Np(YV) = {wEP:(v,w) 是 PUQ 中 的 一 条 边 }。 

有 趣 的 是 {No(v):vEP} 可 以 用 包含 关系 进行 排序 。 
即 对 于 任意 两 个 顶点 vi,v.EP， 要 么 No(v)S No(v,),， 要 
么 No(v,) CE Nlv,)。 

定理 7-10 可 利用 集合 包含 关系 对 集合 {No(v):vEP} 
排序 。 

证 明 : 反 证 。 假 定 x,vEP， 满足 No(W) N60Y) 
且 NV)K No(w)。 又 假定 w.ENo(w) 但 w,ENo(Y)。 同样 地 ， 
wiENo(V) 但 w; 儿 No(u)。 由 于 wwsEQ， 它 们 是 相 邻 的 。 图 7-3 圈 的 形成 
又 由 于 uwEP， 它 们 也 是 相 邻 的 ， 见 图 7-3。 但 是 根据 w,,w, 的 选取 ， 有 wu 与 w; 不 相 信 ，v 与 w, 不 相 
邻 。 因 此 ，u-v-wi-w; 导 出 一 个 无 纺 图 。 这 与 G 是 荡 图 矛盾 。 定 理 得 证 。 

推论 7-1 假定 C = CpUCo 是 纹 图 双 团 Gpuo 的 任 一 极 大 团 ， 这 里 CoMmMP 与 CoNQ 都 非 空 集 ， 则 
Cs 是 集合 {NAX)Ix E Co} 的 最 小 集 ，Co 是 集合 {No(X)Ix E Cy} 的 最 小 集 。 

算法 Biclique-MC 

输入 : 图 G，ACV 有 BCV 

AUB=V,ANMB=9@。@ 


u V 





Ni(u) Nt) 
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团 P。 

团 @， 
输出 : 由 Gpuo 产 生 的 团 列 表 ， Gruo 是 G 的 极 大 团 
BEGIN 


pa 


.Compute {No(v):v € P} 

Sort these sets with set inclusion and sort the vertices of P according to this order 

Compute {Np,(W:u € O} 

. Sort these vertices with set inclusion and sort the vertices of Q according to this order 

. Find the vertices v, in the list P such that No(vi) is a proper Superset of No(vVi,) 

, Each vertex v chosen in step 5 yields a different maximal clique CO U Qs(v). Ov) . 
consists of v and every vertex of P with the same or larger neighbor set in OQ. That is, 


Qa (V) = {v} U {w : Noe(w)No(v)} 


Given Os,(v), we can find Qs(v) by Corollary 7.11 we may also need to include the 


cliques P and O ， 
7. Decide which maximal cliques of the biclique Cruo are maximal cliques in C 

END 

在 讨论 上 述 算法 的 复杂 度 之 前 ， 我 们 首先 来 看 一 看 如 何 执行 第 7 步 。 定 义 一 个 记号 : 如 果 
v 儿 PU 0Q,ulPw) = P 的 顶点 排序 列表 中 最 高 顶点 ， 使 得 No(u(P,v))C No(v)。 对 于 满足 上 述 条 
件 的 顶点 可 能 不 存在 。 类 似 地 ， 我 们 也 可 定义 ux(Q8, v)。 

定理 7-11 假设 C 是 Gruo 的 一 个 极 大 团 ， 且 满足 

1.CmnPz 中 ; 

2.CNOzOD; 

3. 对 于 任 一 顶点 Vv 严 PU QO，C 和 包含 u(Pwv) 或 包含 (Ow)。 

则 C 也 是 G 的 极 大 团 。 

读者 可 参照 Naor, Naor 和 Schaffer(1989) 给 出 定理 7-11 的 证 明 。 

根据 上 面 的 定理 ， 可 以 执行 算法 Bi-Clique-MC 的 第 7 步 。 下 面 我 们 讨论 算法 Bi-Clique-MC 
的 复杂 度 。 ， 

复杂 度 分 析 第 1 ~ 4 步 需 用 O(n”) 个 处 理 器 ， 执 行 时 间 为 O(log nn); 第 5 步 用 同样 多 的 处 理 
器 且 执 行 0(1) 时 间 ; 第 6 步 中 ，Q4s(v) 是 P 的 前 组 (prefix)，Q4s(v) 的 大 小 是 P 中 v 的 秩 ，Qs(Y) 与 
Nol(v) 相 间 ， 因 而 对 于 每 一 个 团 Q(v)， 用 一 个 处 理 器 的 执行 时 间 为 O(log n)。 对 于 Q(v) 中 每 一 个 
元 素 ， 我 们 设计 用 一 个 处 理 器 来 输出 结果 ， 因 此 执行 时 间 为 O(log n)， 处 理 器 数 为 O(m + n)。 
计算 x(P, v) 和 u(Q, v) 所 需 的 处 理 器 数 为 O(m*)， 执 行 时 间 为 O(log n)。 因 此 第 7 步 所 需 的 处 理 器 
数 为 O0z2) ， 执 行 时 间 为 CO(log n)。 

我 们 已 经 了 解 了 求 双 团 的 所 有 极 大 团 的 过 程 ， 下 面 来 描述 求 一 个 图 的 所 有 极 大 团 的 NC 算法 。 

算法 Max-Cliques 

输入 : 图 G = (V, E) 

输出 : 图 G 的 极 大 团 列 表 

BEGIN 

l.LetV=AUB, 
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where A MB = DB and lAl= |1BI (approx.) 

2. Compute all the maximal cliqgues of G, and Gs recursively 

3. For every pair of maximal cliques P of G, and QO of Gs compute all the maximal cliques 
of C in the induced subgraph Cruo which is a bi-clique 

4. Eliminate duplicate cliques occurring in more than one bi-clique 

END 

由 于 在 每 一 次 递归 调用 中 顶点 的 数目 减 半 ， 因 而 总 的 递归 调用 次 数 为 O(log n)。 

在 每 一 次 递归 调用 中 我 们 利用 Bi-Clique-MC 算 法 ， 去 掉 完 全 相同 的 团 需 用 O(n 个 处 理 
器 ， 总 的 执行 时 间 为 O(log? n)。 因 此 计算 弦 图 的 极 大 团 用 O(n”) 个 处 理 器 ， 共 需 执行 时 间 为 
O(log’ 站。 

弦 图 的 一 些 子 类 C. Xavier 等 人 (1990) 已 经 定义 了 树 的 路 和 的 两 类 交 图 。 如 果树 7 中 不 
存在 这 样 一 个 顶点 ， 它 是 路 往 中 至 少 一 条 路 的 内 部 顶点 ， 这 样 的 路 镁 称 为 是 完美 的 (perfect)。 
树 的 完美 顶点 路 秘 的 交 图 称 为 完美 项 点 路 图 或 PV 图 。 如 果树 7 中 不 存在 这 样 一 条 边 ， 它 位 于 
路 簇 中 至 少 一 条 路 中 ， 则 称 这 样 的 路 徐 是 紧 的 (compact)。 树 的 紧 顶 点 路 秘 的 交 图 称 为 紧 项 
点 路 图 或 CV 图 。 由 观察 可 知 ，CV 图 是 RD 图 和 PV 图 的 子 集 ， 也 是 DV 图 的 子 集 。 


7.3 CV 图 的 特征 


由 定义 知 ，PV 图 是 UV 图 ，PV 图 不 必 是 RDV 图 ，RDV 图 不 必 是 PV 图 ，CV 图 不 必 是 区 间 
图 ， 每 一 个 区 间 图 不 必 是 CV 图 。 下 面 我 们 给 出 CV 图 的 儿 个 特征 。 

定理 7-12 对 于 每 一 个 图 G 下 面 的 叙述 是 等 价 的 。 

a. G 是 树 刀 中 边 不 相交 的 路 禾 严 的 交 图 ; 

b. G 是 树 思 中 边 不 相交 的 子 树 著 严 的 交 图 ; 

c. 存在 一 个 树 T 满 足 V(T) = C(G)， 使 得 已 = {TTC.(C)],yE 从 是 树 7 的 边 不 相交 的 路 芒 ; 

d. G 不 包含 K,-e 或 C,(n > 4) 作 为 它 的 诱导 子 图 。 注 意 K-e 由 KK 去 掉 一 条 边 e 得 到 ， 其 中 区 是 

金 4 个 顶点 的 完全 图 ; C, 是 含 n 个 顶点 的 图 ， 

e. G 是 一 个 块 图 。 

定理 的 证 明 留 给 读者 作为 练习 。 

假定 G 是 一 个 CV 图 ，C 是 G 的 一 个 分 离 团 。 记 GC, = G[V; U C] 是 分 离子 图 ，1Sisr，r>2。 

命题 7-1 W(G) 是 一 个 独立 集 ,，1 <i<r。 

证 明 : 很 显然 ，W(G) 是 非 空 的 。 如 果 IW(G)I> 2， 则 不 难 证 明 G, 含 有 Ks-e 作 为 它 的 诱导 子 
图 ， 这 与 G 是 一 个 块 图 矛盾 。 

推论 7-2 如 果 图 G 的 每 一 个 分 离子 图 都 是 CV 图 ， 则 图 G 是 CV 图 。 

证 明 : 假定 每 一 个 分 离子 图 G;,，1 < i<r， 都 是 CV 图 。 因 此 每 一 个 G 都 是 块 图 。 又 根据 命 
题 7-1， 每 一 个 W(G;) 都 是 独立 集 ， 因 此 G 是 一 个 块 图 ，G 是 CV 图 。 

CV 图 判别 算法 ”我 们 提供 了 一 个 线性 时 间 算 法 来 判别 CV 图 。 如 果 图 是 CV 图 ， 那 么 就 可 
以 构造 一 个 交 图 模型 。 

算法 CV test 

输入 : 用 相 邻 列表 表示 的 图 G = (V,E) 


tb 
[3 
[ea 


MD 
kt 
> 





kt 
Oo 
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输出 : 如 果 图 G 不 是 一 个 CV 图 ， 输 出 “No”， 否 则 输出 图 G 的 一 个 CV 团 树 T 
BEGIN 
1. 1f G is not a block graph, then output No” 
. Find all clique of G. Let Ci, C,, *…, C, be the cliques of G 
3. Find the set {C Cr,***, Cin} of cliques containing v, 
li<n 
4.T=T(Vo,Eo), where Vo is the set of all clique of G and 
下 。= 中 


[ey 


.Fori= ltomdo 

6.T=T(V., E,), where V,= Vand 
7T.E=E Ut{G,G,1<j<r-1} 
8. If rx,> 1 return else E,= E,, 

9. End for 


7.4 路 图 判别 


本 节 我 们 介绍 C. Xavier 提出 的 判别 UV 图 (路 图 ) 的 一 个 NC 并 行 算法 。 我 们 采用 与 弦 图 
判别 完全 不 同 的 策略 。 从 下 面 两 个 简单 的 事实 谈 起 。 

事实 7-1 ”如 果 G 是 一 个 UV 图 ，v 是 G 的 一 个 顶点 ， 与 包含 顶点 v 的 团 相 对 应 的 团 树 T 的 顶点 
导出 7 中 的 一 条 路 。 

事实 7-2 ”在 一 个 区 间 图 中 ， 极 大 困 可 以 被 线性 排序 且 对 于 任 一 项 点， 包含 v 的 团 在 线性 排 
序 中 是 连续 的 。 换 和 话说， 区间 图 的 团 树 是 一 条 路 ， 且 对 于 任 一 顶点 v， 与 包含" 的 团 相对 应 
的 顶点 组 成 一 条 子路 。 

如 果 G 是 UV 图 , 根据 定理 7-14 可 以 证 明 , 包含 顶点 v 的 极 大 团 的 并 (union) 导 出 一 个 区 间 图 。 
对 于 G 的 每 一 个 顶点 vy， 我 们 可 以 并 行 验证 包含 v 的 极 大 团 的 并 是 否 是 区 间 图 。 如 果 对 于 菜 个 顶 
点 ， 包 含 它 的 极 大 团 的 并 不 是 区 间 图 ， 我 们 可 以 得 出 G 不 是 UV 图 。 如 果 对 于 任 一 顶点 v， 包 含 
它 的 极 大 团 的 并 都 是 区 间 图 ， 我 们 可 以 得 出 相应 的 区 间 图 的 PQ 树 表 示 公 式 。 对 于 这 些 PQ 树 表 
示 ， 我 们 试图 给 出 图 G 的 团 树 表示 公式 ， 如 果 不 能 写 出 表示 公式 , 便 可 以 得 到 图 G 不 是 UV 图 。 
7.4.1 节 介绍 一 些 基 本 概念 和 几 个 简单 的 事实 ， 这 些 事实 对 于 算法 设计 是 必须 的 ; 7.4.2 节 主要 
介绍 算法 总 框架 ; 后 面 几 节 主要 给 出 具体 算法 并 讨论 算法 的 正确 性 与 复杂 度 。 


7.4.1 一 些 概念 和 事实 


我 们 首先 给 出 几 个 记号 ， 接 着 考虑 极 大 团 ， 因 而 以 下 所 说 的 团 仅 指 极 大 团 。 假 定 G 是 一 个 
续 图 ，T 是 它 的 团 树 表 示 ， 如 果 大 写 的 阿拉 伯 字 母 C 表 示 G 的 团 ， 那 么 相应 的 小 写 c 表 示 树 中 对 
应 于 C 的 顶点 。 

如 果 a 是 G 的 顶点 ， 则 C,. 表 示 包 含 a 的 图 G 的 团 徐 ， 即 

C. = {C:C 是 图 G 的 团 且 a € C} 

令 G, 表 示 C, 中 所 有 团 的 并 导出 的 图 。 如 果 x 和 2 是 G 的 两 个 顶点 ，C = Ce U Co Co = Cn 

C,。 在 Ce 和 Cu 中 所 有 团 的 并 导出 的 图 分 别 记 G 和 Gw。 
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考虑 图 7-4a 所 示 的 图 C， 它 的 团 为 C, = {a,b,cd}, C, = {ed}, C; = {df,8}, C, ={d,g,h}， 
Cs= {sh,r}, Ce= {RrDp，C = {p,q}。 





图 7-4 
a) 弦 图 G 的 表示 G。b) 图 Gs 和 它 的 田 树 T，c) 图 G, 和 它 的 团 树 7 


C = {C1,C2,C3,C,Cs,Co,C)} 

由 于 顶点 a 仅 在 C, 中 ， 因 此 C. = {Cl}。 同 样 地 ，C, = {Cl}，C. = {C1}。d 包 含 在 C1,C2,C; 和 
Cs 中 ， 因 此 C= {Ci,C2,C3,C4}。 类 似 地 ,，C.= {Cs}, C= {C3}, Cs= {Cy,Cs}, C= {CCsCe}, 
C, = {Cs,Cs}, Co = {C1,Cs,Cs,CoCs,Ce), Cn = {Cs}。 

我 们 首先 证 明 关 于 弦 图 的 一 般 性 结论 ， 这 些 结论 直接 或 间接 地 用 于 算法 设计 中 。 

定理 7-13 ”假定 G 是 一 个 弦 图 ，T 是 它 的 团 树 表 示 ， 则 T 的 每 一 个 非 叶子 顶点 表示 G 的 一 个 
分 离 团 。 


证 明 : 设 c 是 7 的 非 叶子 顶点 ， 并 且 使 得 cic: 都 与 cr 相 邻 。C,C,C: 是 这 样 的 团 ， 满 足 任 一 个 


团 都 不 包含 在 另外 两 个 团 中 。 因 此 存在 顶点 a 和 b， 使 得 
a EC, 但 a 疾 C， 因 而 有 a 儿 C;; 
bEC,, 但 b 儿 C， 因 而 有 b FC。 
我 们 证 明 G 中 从 a 到 b 的 每 一 条 路 必 经 过 C 的 一 个 顶点 。 假 设 P = ai,42,a3,…,as 是 任 一 条 从 a 


htD 
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到 1 的 路 ， 这 里 a = a1,b= a4。 记 S51,5,…,5 是 与 顶点 a1,q2…,at 相 对 应 的 T 的 子 树 。 

记 5 = Si U 9 U…U 5,， 则 5 是 7 的 子 树 ，c, 和 c, 都 在 5 中 ， 因 而 T 中 从 ci 到 c, 的 一 条 路 完全 落 
在 S 中 ， 因 此 c E 5。 这 意味 着 存在 某 个 1， 使 得 c E 98。 因 此 aw E C。 由 于 P 是 任意 的 ， 每 一 条 从 
a 到 5 的 路 必 经 过 C 的 一 个 顶点 。 这 证 明了 C 分 离 4e 和 b5， 因 此 C 是 一 个 分 离 团 。 

现在 我 们 来 证 明 一 个 主要 结论 ， 它 是 下 面 算法 设计 的 基础 。 

定理 7-14 如 果 G 是 一 个 UV 图 ， 则 对 于 G 的 任 一 顶点 a，Gs 是 一 个 区 间 图 。 

在 证 明 这 个 定理 之 前 ， 我 们 用 一 个 例子 来 说 明 这 个 结论 。 考虑 图 7-5a 所 示 的 弦 图 。 这 个 图 只 
有 6 个 团 ， 分 别 是 C, = {apf8}, C= {bf8 有 hh}, C= {bg 有 hCG= ghd}, C= hl}, C= {pp}。 

这 里 8 包含 在 C1,C2,C; 和 Cs 中 ， 因 此 Cs， = {Ci,C2,C3,C4}。 图 7-5b 表 示 G,， 不 难 验证 ，G, 不 是 
一 个 区 间 图 。 因 此 ， 根 据 定理 7-14，G 不 是 一 个 UV 图 。 





图 7-5 
a) 用 来 验证 定理 7-19 的 纺 图 G b) 图 G, 不 是 区 间 图 
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证 明 : 设 P。 = C1,C,…,Ci 是 T 中 相应 于 顶点 a 的 一 条 路 ， 则 C， = CU CUU Ce G, 的 团 
是 C1,C2… ,Ci。 已 知 C1,C,…,C:， 是 线性 排序 ， 且 对 于 G 中 任 一 顶点 2，G. 中 包含 6 的 团 连续 出 


现 。 假定 b 是 6。 的 任 一 顶点 ，G 中 包含 bp 的 田 组 成 7 中 一 条 路 ， 记 这 条 路 为 P= cicz…cv。 
由 于 b € G,, P. mn P, 非 空 ， 又 因为 7 是 一 个 树 ，P。 和 已 是 它 的 两 条 路 且 己 .站 P, 非 空 ，P, 站 


P 是 P, 和 P, 的 子路 。 特别 地 ， 已 门 已 是 已 的 子路 ， iaP, MN P, = cea Cn, 这 意味 着 包含 2 的 G。 


的 田 是 C， Cs 因此 G, 是 一 个 区 间 图 。 
定理 7-14 反 过 来 不 成 立 。 考虑 图 7-6a， 它 的 6 个 团 分 别 为 Co 三 {abd,ef} CC = {a,bd,e,h}, 


C, = {a,b,d,i}, Cs 二 {a,b,de fj}, C, 二 {《a:,e,， Cs 三 {a,L,g}, Ce 三 {efr}. 
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图 7-6 
a) 弦 图 C 不 是 UV 图 b) G.,G, 等 的 区 间 表 示 


C,= {CoCC2C3C4eC} 
C, = {Co,C,C,} 

C,= {Co,Ci,C,,C;} 

C, = {Co,Ci,C;,Cs,Ce} 
CGC,= {Co,C3,Ce} 

C= {CC;} 

C,= {C;} 
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C, = {Ce} 
C= {C} 
C= {C,} 
C = {C;} 
图 7-6b 描 绘 G,,G,,Gs,G.,Gj,G, 的 区 间 表 示 ， 因 此 对 于 G 的 每 个 顶点 vy, G, 是 区 间 图 。 我 们 可 以 
证 明 图 G 不 是 UV 图 。 
推论 7-3 如 果 a,b 是 UV 图 G 的 两 个 顶点 ， 则 Gs 是 区 间 图 。 
证 明 : G, 是 一 区 间 图 ，G。 是 C。s 中 包含 bp 的 团 的 并 的 导出 图 。 因 而 ， 根 据 定理 7-14，G 是 
区 间 图 。 
推论 7-4 如 果 G 是 一 个 UV 图 ，aia…;a 和 1 是 G 的 顶点 ， 且 Co 是 LV 图， 
则 Gliasairaw 是 区 间 图 。 


7.4.2 算法 概述 


本 节 我 们 介绍 算法 是 如 何 实现 的 。 给 定 一 个 一 般 图 G, 利用 Klein 算 法 验证 图 G 是 否 是 弦 图 。 
如 果 C 不 是 弦 图 ， 则 G 不 是 UV 图 。 如 果 G 是 汞 图 ， 我 们 列 出 G 的 所 有 的 团 ， 并 且 对 G 的 每 一 个 
顶点 a， 求 出 C.。 对 于 每 一 个 顶点 a， 我 们 并 行 验证 G, 是 否 是 区 间 图 。 根 据 定理 7-14， 对 于 G 的 
每 一 个 顶点 a， 如 果 G. 不 是 区 闻 图 ， 则 可 知 G 不 是 UV 图 。 如 果 G. 是 区 间 图 ， 可 以 求 出 CG. 的 团 树 
表示 以 及 它们 的 线性 排序 。 假 定 T, 是 由 团 的 线性 排序 组 成 的 一 条 路 ， 如 果 Ci,C;,…,C; 是 区 间 图 
G, 的 团 的 线性 排序 ， 则 表示 路 cycs,… ,ci。 

记 {awa2…,as} 是 G 的 顶点 集 ，n, 为 包含 a 的 团 的 个 数 。 假 定 a,,a,,…,a, 按 这 样 方法 排序 使 得 
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开始 我 们 使 用 过 个 处 理 器 并 行 处 理 ， 每 个 处 理 器 做 连接 两 个 图 G. 的 操作 并 且 验 证 它们 的 
并 是 否 是 UV 图 。 一 个 处 理 器 执行 G。,。, 并 且 验 证 它 是 否 是 UV 图 ， 另 一 个 处 理 器 执行 G6。,, 并且 
验证 它 是 否 是 UV 图 ， 等 等 。 即 如 下 操作 : 

For i = 1 to n/2 do in parallel 

Check whether Co is a UV graph 

End parallel 

当 n = 8 时 ， 这 个 过 程 如 图 7-7 所 示 。 上 述 过 程 可 描述 成 如 下 的 NC-UV(G) 算 法 。 

算法 NC-UV(G) 

输入 : 无 向 简单 连通 图 G 


输出 : G 是 否 为 UV 图 
1: Check if G is chordal. If G is not chordal abort the algo rithm because G is not a UV graph 
2: List the cliques of G and also list G, for every vertex a of G 
3: Arrange the vertices of G as aa Such that 
Po 2 ha, > ns 六 >] 
Assign ko=n 
Rename Cu as Gforl<ikn 
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4: 

4.1 For j= 1 to [log n] do 

4.2k=k/2 

4.3 For i= 1 to k do in parallel 

4.4 PROCESS (2i-1, 2i) 

PROCESS (i,)) is a procedure which takes the UV graphs C and G, and checks 
whether CU G, = G,, is a UV graph. If G;, is a UV graph it returns the clique tree 
representation T,, of G,, 

4.5 If Cis not a UV graph the fact is informed and the entire algorithm is aborted and 
terminated because, in this case G is not a UV graph. If Co is a UV graph rename it 
as G, for the next iteration 

4.6 End parallel 

4.7 Nextj 

5: Conclude that G is a UV graph 
End NC-UV 





Gal Ga Ga3 Ga4 Gas Ge Gar Gas 
图 7-7 n = 8 时 的 算法 过 程 


7.4.3 两 个 UV 图 的 并 


本 节 我 们 设计 程序 PRECESS(ij)，PRECESS(iy) 用 于 算法 NC-UV 中 ， 它 对 两 个 UV 图 G, 和 
G 进 行 操作 ， 同 时 还 需 输入 它 的 团 树 表示 T, 和 T,， 验 证 G; U G 是 否 是 UV 图 。 如 果 G; U G 是 UV 
图 ， 则 返回 它 的 田 树 表示 ， 否 则 退出 算法 。 我 们 注意 到 G: U G6; 是 6 的 某 些 团 的 并 导出 的 图 。 
G, 或 6, 的 团 恰 是 G 的 田 ， 我 们 记 
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C， 三 G. 的 团 簇 ; 
Ci = 6G, 的 团 镶 。 


由 于 Cn 6, 是 6; 的 诱导 子 图 ， 因 而 也 是 UV 图 。 在 G; 中， 去 掉 所 有 与 Ci mn C, 的 元 素 对 应 
的 顶点 以 及 与 顶点 相关 联 的 所 有 的 边 ， 最 后 得 到 7 的 子 树丛。 我 们 试图 将 九 的 每 一 个 这 样 的 子 
树 与 7 连接 起 来 并 构造 G; U G, 的 团 树 。 首 先 给 出 算法 PRECESS(i))。 

程序 PROCESS(i, j) 

输入 : 两 个 UV 图 G, 和 G, 以 及 它们 相应 的 团 树 表示 7T, 和 TT 

输出 : 1. G, U G, 是 否 为 UV 图 


La ~ 


~ 


LA 


人 


~ 


‘© 0 


2. 如 果 G;U G, 是 UV 图 ， 输 出 该 图 的 团 树 模型 


.For every CE C,N C, do in parallel 
. Let cl C2,°°°C, be the nodes adjacent to c in T, Such that ce FE CNC, Gigiegs) 
. Remove c from T,. This removal causes a forest of s subtrees of T,. Consider these trees as 


subtrees with roots cu, c,,*', C, respectively 


. End Parallel 
. Let R = set of subtrees (rooted) of Ti left out after steps 1 to 4 
. For every element ST of R do the operation which where going ATTACH(ST, T.) explained 


in step-7 


. ATTACH(ST, T,) Let c' be the root of ST. We try to join ST to 也 by creating an edge 


between c' and a node c of T; where C' NN G, abort because G, MN G, is not a UV graph 


. End for 
. End PROCESS 


我 们 将 在 下 面 对 ATTACH(ST,T) 作 详细 解释 。 首 先 列 出 一 些 附加 结论 。 

改进 UV 图 的 团 树 假定 G 是 UV 图 ,7 是 它 的 团 树 表示 ,，C 是 6 的 一 个 团 , v 是 C 的 一 个 顶点 。 
我 们 首先 设计 如 下 一 个 过 程 。 

为 了 验证 团 树 7 能 否 被 改进 ， 使 得 是 T 中 对 应 于 v 的 一 条 路 的 端点 ， 改 进 的 T 依 然 是 UV 图 G 
的 田 树 表示 。 下 面 我 们 详细 解释 这 个 验证 过 程 。 

如 果 c 已 经 是 7 的 叶 节点 或 者 已 经 是 v 的 一 条 路 的 端点 ， 则 已 经 完成 解释 。 下 面 我 们 假定 c 
不 是 叶 节 点 且 在 7 的 一 条 含 v 的 路 中 ，c 是 它 的 中 间 顶 点 。 考 虑 以 c 为 根 的 有 根 树 T。 设 7 中 一 条 
含 v 的 路 为 ciciy*…cscicciC2*…C。 

情形 1 

假定 存在 整数 i 和 A(1 < i<1, 1<j<r)， 使 得 (C; mM CNC) #* $B, (C, 几 CNC 中。 考虑 C 作 为 一 
个 分 离 团 ， 团 C; 和 C; 位 于 C 的 两 侧 (定理 7-13)， 因 此 我 们 不 能 重新 调整 7 使 得 c 是 "的 路 的 叶 节 
点 ， 并 且 7T 仍 然 是 UV 图 G 的 田 树 表示 。 可 以 证 明 : 如 果 c 是 7 中 v* 的 路 的 端点 ， 要 么 c; 必须 位 于 
从 c 到 c 的 路 上 ， 要 么 c; 必 须 位 于 从 c 到 ci 的 路 上 。 

假定 


aE(CnCNC' 
EC mn CNC， 


由 于 a 的 路 经 过 c; 和 <c 而 不 经 过 c,， 我 们 不 能 重新 调整 使 得 c, 位 于 从 c 到 c 的 路 上 。 类 似 地 ， 
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由 于 b 的 路 经 过 c 和 cj 而 不 经 过 c;:， 我 们 不 能 重新 调整 使 得 c; 位 于 从 c 到 c 的 路 上 。 因 此 T 不 能 按 
要 求 重新 安排 。 
考虑 图 7-8 所 示 的 图 G。 团 树 T 给 定 ， 假 定 我 们 设法 改进 T， 使 得 c 成 为 相应 于 顶点 5b 的 树 的 
端点 。 我 们 有 : 
(CN ONC, = {f}; 
(CN CNC = {4d}. 





a b e 
f 图 G d 
Ci C C2 


图 7-8 用 来 描述 MODIFY 定 义 的 图 G 


因此 ， 我 们 不 能 改进 团 树 ， 使 得 c 成 为 相应 于 顶点 2 的 路 的 端点 。 

情形 2 

假定 (C, mn OC,。 这 时 ， 根 据 分 离 团 C，C, 控 制 C,。 现 在 我 们 打算 从 c 上 去 掉 c,、 并 使 c\ 成 为 ce。 [238 
的 孩子 。 首 先 ， 需 要 验证 某 些 事实 。 假 定 C 与 C, 的 每 个 孩子 都 不 相 邻 ， 这 时 ， 很 容易 从 c 上 去 掉 
ci 并 使 之 成 为 c, 的 孩子 。 假 定 c 是 c 的 孩子 是 Co mn Ci ,并 注意 CnmcC CC， 这 时 ， 如 果 想 
使 c' 成 为 c, 的 孩子 .我 们 必须 去 掉 cw 并 使 它 成 为 其 他 点 的 孩子 。 由 于 Cu mn Cize，cCunc ccC， 
我 们 必须 设法 使 c。 成 为 c 的 孩子 。 仅 当 CnmC' CC 时 才能 这 样 做 。 因 此， 对 于 c 的 每 一 个 孩子 ci， 
验证 是 否 有 C,,, MC, CC 成 立 。 如 果 成 立 ， 从 c, 上 去 掉 c,,,， 并 使 它 成 为 < 的 孩子 。 去 掉 所 有 这 样 的 
cu 后， 我 们 从 c 上 去 掉 c1， 并 使 它 成 为 ,的 孩子 。 对 于 基 个 孩子 c,， 如 果 Ci, 站 Ci# 听 ， 且 Ci 站 CC 
不 包含 在 C， 我 们 就 不 能 从 c, 上 去 掉 c,,， 因 此 不 可 能 使 c' 成 为 c 的 孩子 。 又 因为 C, 控 制 C,， 我 
们 不 能 用 这 样 的 方式 改进 路 ， 即 使 c1 位 于 c 到 c, 的 路 上 。 这 也 证 明了 我 们 不 能 改进 树 使 得 c 是 7 
中 含 y 的 路 的 端点 。 

考虑 图 7-9 所 示 的 UV 图 ， 这 个 图 包含 6 个 团 ， 分 别 为 

C= {abdf}, Ci= {bdf8}, C= {dfh}, Cs= {dfi}, C= {dij}, C= {fk}. 

图 7-9b 给 出 了 这 个 UV 图 的 团 树 表示 T， 在 团 树 中 ， 相 应 于 d 的 路 是 C;,C,,Co,C3,C:。 假 定 我 
们 对 改进 的 树 T 感 兴趣 ， 改 进 的 树 T 满 足 T7 中 关于 4d 的 路 以 Co 为 端点 。 

注意 ， 相 对 于 分 离 团 C。 C,、C;、C; 位 于 分 离 团 C6 的 一 侧 ， 而 Cs 位 于 Co 的 另 一 侧 。 同 样 ， 
Cl,、C,、C; 位 于 分 离 团 C 的 一 侧 ， 而 Cs 位 于 Co 的 另 一 侧 。 上 述 情形 不 满足 情形 1。 然 而 我 们 发 ”|239 
现 ，C, 阁 CG, CC,nNnc,， 即 相应 于 分 离 团 C。， CC,。 因 此 可 以 使 C; 成 为 C, 的 孩子 。 为 此 ，C， 
必须 和 C; 的 每 个 孩子 都 不 相 邻 。 这 里 C; 是 C; 的 孩子 ,但 是 ，C; mn C; = @。 因 而 ， 如 果 我 们 想 
使 C; 是 C, 的 孩子 ， 就 必须 把 C; 移 到 其 他 位 置 。 所 幸 的 是 ，C; 门 C, CC,。 因 此 ， 我 们 从 C; 上 去 
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掉 C; 并 使 它 成 为 C 的 孩子 ， 然 后 从 Co 上 去 掉 C; 并 使 它 成 为 C, 的 孩子 。 图 7-9 就 是 改进 的 树 。 我 
们 注意 到 在 这 个 改进 的 树 中 ，C。 是 ad 的 路 的 端点 ， 并 且 改 进 的 树 T 依 然 是 UV 图 G 的 团 树 。 


Ci 


Cs 





c) 


图 7-9 
a) 情形 2 中 的 UV 图 b) G 的 团 树 c) 改进 的 团 树 


情形 3 关于 分 离 团 C， 假 定 C "控制 C,。 这 与 情形 2 类 似 。 
情形 4 ”假定 顶点 c 不 满足 情形 1，2，3。 由 于 不 满足 情形 1， 则 对 于 任意 的 :和 | (1 < i<1, 
1&j&r)， 要 么 C;> C,， 要 么 C)> Ci。 然而， 在 i = 1,j = 7 的 情形 下 ， 我 们 有 C' > C,。 类 似 地 ， 
当 i = 1, j= l! 时 ，C'> C,。 在 这 种 情形 下 ， 设 法 按 线性 顺序 排列 C,C,…CCiC，…C,， 重 新 命名 
这 些 团 为 B,8,…B,B,,.…B,,,， 这 里 B,= Ci(l1 iD 站 ,B=C(l <j«7)。 
现在 我 们 用 下 列 方法 对 这 个 新 的 序列 进行 重 排 ， 满 足 
IB.NM CI>1B,N CI>1B, MN Cl> :21B,,N Ol 
现在 验证 对 于 任 一 对 满足 1 < i<j< itr 的 整数 i, j， 分离 团 C 是 否 有 B;> B,。 如 果 B,> B,> B,> 
… > B,,， 我 们 重新 构造 v 的 路 为 cb,b.…b,,。 
由 于 不 满足 图 G 的 其 他 顶点 的 路 的 性 质 ， 要 首先 改进 树 使 得 cb,5,…bi, 是 v 的 路 ， 做 法 如 下 : 
1. 去 掉 边 cei,cicz,… ,cies 
2. 去 掉 边 cectcy,… CC; 
3. 增加 新 的 边 cb1,b,b,,b2b;、… ,bubnr。 
不 难 验 证 ， 经 过 上 述 改进 后 ，T 依 然 是 一 个 树 。 我 们 要 验证 ， 对 于 UV 图 G，7 是 否 依然 满 
足 团 树 性 质 。 为 此 ， 对 于 每 一 个 i(1 <i< 1+r)， 都 要 进行 验证 。 假 定 b。 = c， 如 果 B;, > B;, 仅 当 
8, 与 b., 的 每 一 个 孩子 b 都 相 离 时 ， 可 以 使 b; 成 为 b, ,的 该 子 。 一 旦 B; 与 5-, 的 一 个 孩子 5 相 邻 ， 就 


Ga 
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必须 设法 去 挤 b， 并 使 它 成 为 其 他 顶点 的 孩子 。 最 初 b; 和 b;, 从 c 的 两 边 来 。B; mn B zx 意味 着 C 
NB zz @。 因 此 仅 使 5 成 为 c< 的 孩子 。 为 此 ， 要 求 BnBSC。 只 有 当 Bm B x ®P 时 ， 检 
验 B 门 B,CC 是否 成 立 。 如 果 成 立 ， 让 b 成 为 c< 的 孩子 ; 否则 ，7 不 能 被 改进 成 所 希望 的 那样 。 
基于 上 述 讨论 ， 程序 MODIFY 可 描述 如 下 : 
程序 Modify (G, T, C, v) 
输入 : 
1. UV 图 G 
2. 6G 的 团 树 表示 了 
3.G 的 团 C 
4. C 的 顶点 v 
输出 : 7 的 改进 形式 使 得 7 中 * 的 路 包含 c 作 为 它 的 端点 ， 而 且 对 于 UV 图 G，7 依 然 满足 团 树 
性 质 。 如 果 T7 不 能 改进 成 所 要 求 的 那样 ， 则 返回 原来 的 7 并 作出 通知 
1: Verify if c is already an end node of the path of v in T. If true return T, else let the path of 
yin Tbe cc cc cccic2Cc Consider T as a rooted tree with root c 
2: Ror every iE{lL23… 站 andjE{l2,…rdothe following in parallel 
If (CN CONC zB 
and (CN CNCi#® 
then return with a message that T cannot be modified 
:IfCNCCC,, then 
3.1 For every child cu of c do in parallel 
3.2 IfCmnmC zx 中 then 
3.3 If (Cn MN CC # ® then Proceed to step 4 
ELSE 
3.4 Delete the edge cic, and create a new edge ci,ic So that c,, is a new child of c 
End if 
End if 
End parallel 
3.5 Delete the edge c'ic and create a new edge c',c, so that ci becomes a new child of c, 


Wy 


3.6 Return T successfully 

End if 
4:If CNCEC,, then 

4.1 For every child C.,,, of C, do in parallel 

4.2If Cu NC Dthen 

4.3 If (C,, N CH)\C # ® then Proceed to step 5 
ELSE 

4.4 Delete the edge c,.ic, and create a new edge cruc so that c,,, becomes a new child of c 
End if 
End if 
End parallel 
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4.5 Delete the edge cic and create a new edge cic' so that c, becomes a new child of c, 
4.6 Return T successfully 
End if 


5.1 Form duplicate copies of the cliques C, C2°**CC', C2°*°C, with new names B', B,, … 
有 DB DB，…B so that Bi = CA(l1 &i&/) and B= C,(l &j<7r). Let the corresponding 
nodes in 了 be denoted by Di, b,,…b,, respectively 
5.2 Sort the cliques such that 


IB, MN CIl21B,NM Cl2 .21B,,N COC 


$5.3 Fori= 1 to {land forj= 1 tor do in parallel 
Remove edges ci -and cic) Here Co means C. While removing keep log of the 
operation because if we are not able to modify 7 as desired we have to return the 
original T with failure message 
End parallel 
5.4 For i = 1 to Il+r do in parallel 
Create a new edge bi and reconstruct the tree T. Assume the notation po for C 
End parallel 
5.5 Fori= 1 to 1+r do in parallel 
5.6 For every child B of B ,do in parallel 
$.71f BNMB,#D then 
5.7.11f BNB ,CCthen 
5.7.2 Remove edge bb, and create a new edge cb 
5.7.2 ELSE 
5.7.3 Report that T cannot be modified as desired undo the change done in steps 5.3 and 
5.4 and return the original T without any modification 
5.7.4 End if 
End if 
5.8 End parallel 
5.9 End parallel 
5.10 Return the modified tree T in success 


现在 我 们 重点 来 设计 程序 ATTACH(ST,T)， 在 程序 PROCESS(iy) 的 第 7 步 使 用 了 这 个 程序 。 
记 Gs; 为 由 ST 的 顶点 表示 的 团 的 并 的 导出 图 。 

用 W(SD 表 示 Gs mn G;。 在 树 荆 中 ，ST 的 一 个 顶点 与 TMT 的 一 个 顶点 相 邻 ，5T 的 顶点 c 与 
TMST 的 顶点 c* 相 邻 。 因 而 有 WST)CC ，W(ST)C C" 。 顶点 c 也 是 7; 的 顶点 。 设 法 使 ST 的 顶点 
c 与 了 的 顶点 c 相 邻 。 然 而 ， 如 果 c 是 ZT 的 顶点 且 满 足 W(ST)S C ， 那 么 我 们 设法 使 与 c 相 邻 ， 
并 使 ST 与 7 相连 。 

记 Nsr = {c:c 是 T 的 顶点 且 W(5TD)C Cy, Ns 是 T, 中 ST 的 所 有 可 能 的 邻 点 集合 。 由 上 面 讨论 
知 c E€ Ns:。 因 而 对 于 每 一 个 子 树 ST，Nsz 非 空 。 通 过 增加 一 条 边 (cc)，5ST 可 与 的 顶点 c 相 邻 
当 且 仅 当 TT 被 改进 ， 且 c 是 关于 W(5D) 的 每 一 个 顶点 的 路 的 端点 。 对 于 W(57T) 的 每 一 个 顶点 可 以 
并 行 验证 这 个 结论 。 对 于 W(SDD) 的 某 一 个 顶点 ， 如 果 T, 不 能 被 改进 ， 那 么 顶点 c 不 能 与 5T 的 顶 
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点 c 相 邻 。 对 于 Nr 的 每 一 个 顶点 c， 可 以 并 行 验证 是 否 c 能 与 c 相 令 。 对 于 Nsr 的 顶点 6<， 如 果 可 
能 的 话 ， 可 以 立即 通过 增加 一 条 新 的 边 (cc ) 来 连接 3S7 与 五。 如 果 不 可 能 使 与 Mr 的 某 个 元 素 
相 邻 ， 可 以 得 出 结论 : 57 不 能 与 7 相连 。 因 而 G; U G) 不 是 UV 图 。 下 面 这 个 程序 目的 是 将 87 连 
到 五 上 。 
程序 Attach(ST,Ti) 

. Let Gsr be the graph induced by the union of cliques represented by the nodes of ST 
. WSD= Gy G, 
Nsr=® 
. For every node c of 7 do in parallel 
.If W(ST)CC then 

Ns = Ns U {c} 

End if 
. End parallel 


一 


. For every c € Nsr do in parallel 
. For every v € W(ST) do in parallel 
. MODIFY(G,, T', c¢, v) 
If the procedure MODIFY returns with failure then exit 
10. End parallel 
11. In loop of steps 8 to 10, if the MODIFY is in failure for any one of the vertex v then 


‘DD oo ~ 个 


remove c from Nsr 
12. End parallel 
13. End parallel 
14. 1f Ns; # DB then choose any node c from Nsr and make c 
adjacent toc 
Else 
Abort the algorithm because we cannot attach ST to Ti and Hence CU G,is not a UV 
graph 
15. End ATTACH 
上 面 这 个 程序 将 子 树 S7 与 7 相连。 在 程序 PROCESS( 力 中 ， 第 6 ~ 8 步调 用 与 R 相 连 的 每 一 
个 子 树 ST7。 然 而 ， 对 于 有 R 的 所 有 元 素 不 能 并 行 执行 上 述 操作 。 对 于 所 有 互 不 相交 的 子 树 S7， 
我 们 试图 并 行 执行 Attach 操 作 。 这 样 ， 第 6 ~ 9 步 FOR 循环 至 多 执行 log n] 次 。 


7.4.4 正确 性 和 复杂 度 


本 节 我 们 证 明 算 法 的 正确 性 并 且 分 析 时 间 和 处 理 器 的 复杂 度 。 

定理 7-15 在 NC-UV(G) 算 法 的 第 4.5 步 中 ， 如 果 Go oa 不 是 UV 图 ， 那 么 G 不 是 UVY 图 。 

证 明 : 由 于 UV 图 是 树 的 路 签 的 交 图 ，UV 图 具有 遗传 性 ， 即 UV 图 的 每 一 个 诱导 子 图 也 是 
UV 图 > Ga 也 是 UV 图 o 证 毕 o 

定理 7-16 ”如果 在 NC-UV(OG) 算 法 的 第 4.1 ~ 4.7 步 的 FOR-NEXT 和 柏 环 共 执行 [log n] 次 ， 并 且 
成 功 地 转 到 执行 第 5 步 而 没有 异常 退出 ,那么 G 是 ZJV 图 。 
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证 明 : 用 G1,G,…,G, 来 表示 NC-UV(G) 算 法 第 3 步 中 得 到 的 G,,G,,,…,G。， 这 里 G 的 顶点 为 
{aw42…,4,}。 在 第 一 次 执行 完 时 ， 有 [n/2] 个 G 的 诱导 子 图 ， 每 一 个 子 图 都 是 UV 图 。 在 第 4.5 步 
的 循环 的 最 后 一 次 迭代 中 ， 按 照 G6 ,的 重新 命名 规则 ，Gs 就 是 G， 因 而 G 是 UV 图 。 

定理 7-17 在 程序 PROCESS(ijj) 的 第 7 步 中 ， 如 果 我 们 不 能 将 ST 与 工 相 连 ， 那 么 G 不 是 UV 图 。 

证 明 : 在 程序 ATTACH(ST,T,) 中 ，Ns 是 ST 的 所 有 可 能 的 邻 点 集合 。 在 程序 ATTACH 的 第 
13 步 中 仅 当 Nsr = 中 时， 我 们 判断 ST 不 能 与 相连 ， 这 意味 着 不 能 改进 T; 并 且 使 得 S57 是 某 个 顶 
点 c 的 孩子 ， 这 里 W(ST)C C 。 如 果 c 是 另外 一 个 满足 W(ST)C C 的 顶点， 那么 至 少 存在 W(5S7T) 
的 一 个 顶点 x， 该 顶点 不 在 C, 中 。 这 样 ， 如 果 $7 与 ci 相连 ， 那 么 xz 的 路 根本 不 能 进入 了 1。 因此 ， 
不 能 将 ST 与 c, 相 连 ， 其 中 W(ST)C C,。 证 毕 。 

定理 7-18 在 程序 MODIFY 的 第 2 步 中 ， 如 果 我 们 返回 T 并 带 有 信息 : 7 不 能 被 改进 。 我 们 
不 能 改进 7 使 得 c 是 v 的 路 的 端点 ，7 仍 然 是 UV 图 G 的 团 树 。 

证 明 : 由 于 (Cn CNC) = 下, (Cj 几 CNC; x 罗 ，c; 和 cj 位 于 分 离 团 C 的 两 边 ， 因 而 c 位 于 从 cc 
到 c, 的 路 上 。 因 此 ， 我 们 不 能 改进 7 使 得 c 是 v 的 路 的 端点 ，7T 仍 然 是 UV 图 G 的 团 树 。 

定理 7-19 第 3.5 和 第 4.5 步 的 操作 并 不 改变 T， 以 致 于 不 遵从 UV 图 G 的 团 树 性 质 。 

证 明 : 除了 记号 外 ， 第 3.5 与 4.5 步 是 一 样 的 。 因 而 ， 这 里 我 们 仅 对 第 3.5 步 讨论 。 对 第 4.5 
步 同 样 成 立 。 在 第 3.5 步 中 ， 我 们 从 c 上 去 掉 c,， 并 使 c1 与 c 相 邻 。 这 样 改变 并 不 影响 C'\C 中 的 
点 。 如 果 v E CANC， 那 么 这 种 改变 根本 不 违背 条 件 。 因 此 可 以 充分 验证 对 于 C Mm C' 中 的 点 ， 
新 的 树 是 否 满足 UV 团 树 条 件 。 

第 3.4 步 中 我 们 去 掉 了 所 有 与 C, 有 非 空 交 的 c, 的 孩子 。 因 此 ， 对 于 C mn C", 中 的 所 有 顶点 的 
终点 是 C,。 因 而 ， 通 过 使 c; 成 为 c 的 孩子 ， 对 于 C mn C' 的 所 有 顶点 ， 路 的 性 质 满 足 。 

定理 7-20 ”在 程序 MODIFY 中 的 第 5.7.3 步 中 ， 如 果 返 回 T， 则 T 不 能 被 改进 ， 使 得 C 是 v 的 
路 的 竟 点 ， 且 对 于 G 中 所 有 顶点 ，T 依 然 满足 路 的 性 质 。 

证 明 : 由 于 经 过 第 5.3 和 5.4 步 ， 对 任何 i 和 j(1 < i<j<r) 有 B,< B,。 在 这 种 情形 下 ， 我 们 设 
法 去 掉 所 有 与 8; 相连 的 B ,的 孩子 。 由 于 我 们 不 能 去 掉 B,, 的 某 些 孩 子 B， 在 第 5.7.3 步 中 返回 T。 
假定 v E€ 8 阁 B,， 那 么 v € B, B,, B;,， 这 三 者 不 能 在 同一 条 路 中 。 证 毕 。 

定理 7-21 算法 NC-UV(G) 可 正确 地 判别 UV 图 G。 

证 明 : 如 果 CG 不 是 弦 图 ， 第 1 步 告诉 我 们 G 不 是 UV 图 。 否 则 ， 对 于 G 的 顶点 a， 如 果 C. 不 是 
区 间 图 ， 那 么 6G 不 是 UV 图 。 如 果 对 于 G 的 每 一 个 顶点 a。，G, 都 是 区 间 图 ， 那 么 我 们 设法 构造 G 
的 团 树 。 如 果 第 5 步 完成 的 话 ， 那 么 G 就 是 UV 图 (定理 7-16)。 如 果 不 能 完成 第 5 步 ， 在 第 4.5 
步 中 异常 退出 ， 这 种 情形 下 ，G 不 是 UV 图 (定理 7-17)。 对 于 任 一 输入 图 ， 算 法 要 么 达到 第 5 
步 ， 要 么 在 第 4.5 步 中 异常 退出 。 因 而 这 个 算法 可 正确 地 判定 UV 图 。 

时 间 和 处 理 器 复杂 度 ”现在 我 们 来 分 析 该 算法 的 时 间 和 处 理 器 复杂 度 。 定 理 7-22 给 出 了 一 
个 范围 ， 这 对 复杂 度 分 析 是 非常 有 用 的 。 

定理 7-22 假定 G=(V,E) 是 一 个 强 图 ， ,表示 包含 v 的 团 的 个 数 ， 那 么 


D™ = Ycl< m+n 


这 里 加 和 nh 分别 表 示 G 的 边 数 和 顶点 数 。 
证 明 : 定义 一 个 矩阵 4(v,c)， 这 里 v EV,c E C， 且 满足 
0,v¢c 


4 vEc 
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对 于 C 的 任 一 个 团 c， 有 
lcl= ZA) 


类 似 地 ， 对 于 任 一 顶点 v EV， 有 
n, = AO) 


因而 有 
Da 之 2400- DO" 


又 因为 1C1< 抑 +n ， 因 而 定理 得 证 。 

定理 7-23 程序 MODIFY 共 需 执 行 时 间 为 O(log n)， 处 理 器 数 为 O(m+n)。 

证 明 : 由 于 在 弦 图 中 至 多 有 n 个 团 ， 因 而 第 2 步 所 需 处 理 器 数 为 C()， 执 行 时 间 为 O(1); 
第 3 步 和 第 4 步 也 需 O(n) 个 处 理 器 ， 执 行 时 间 为 0(1); 在 第 5 步 中 ,第 5.2 步 中 ,排序 共 需 执行 时 
间 O(log mn)， 处 理 器 数 为 O(n log n)。 第 5.6 ~ 5.8 步 共 需 时 间 O0(1)， 处 理 器 数 O(n)。 第 5.5 ~ 5.9 
步 是 一 个 循环 ， 完 全 包含 循环 5.6 ~ 5.8， 在 5.6 步 中 提 到 的 B,, 至 多 有 IB, | 个 孩子 。 在 第 5.5 步 中 


提 到 的 1+r 是 团 的 个 数 的 界 , 因此 第 5.5 ~ 5.9 步 共 需 处 理 器 数 有 一 个 界 入 11 <m+n (定理 7-22)， 


因而 5.5 ~ 5.9 步 共 需 处 理 器 数 为 Ol(m+n)， 执 行 时 间 为 0(1)。 所 以 程序 MODIFY 共 需 执行 时 间 
为 O(log n)， 处 理 器 数 为 O(m+n)。 证 毕 。 

定理 7-24 程序 ATTACH(ST,T) 共 需 执 行 时 间 O(log n)， 处 理 器 数 为 O((m+n)?)。 

证 明 ; 第 !，2，3 步 共 需 常数 执行 时 间 ， 第 4~ 6 步 共 需 执 行 时 间 为 0(1)， 处 理 器 数 为 O(n)。 
注意 到 INsd < 1Cl;，IW(GST)I< 1VI。 因 此 ， 根 据 定理 7-22， 每 一 次 并 行 执行 MODIFY 共 需 O(m+n) 
个 处 理 器 。 根 据 定理 7-23， 第 7 ~ 13 步 共 需 执行 时 间 O(log n)， 处 理 器 数 为 O((m+n)))。 所 以 程 
序 ATTACH 共 需 执 行 时 间 O(og n)， 处 理 器 数 为 O((m+n)”)。 

定理 7-25 程序 PROCESS(i, 门 共 需 执行 时 间 O(log? n)， 处 理 器 数 为 O(m? 门 。 

证 明 : 第 1 ~ 4 步 共 需 执 行 时 间 O(1)， 处 理 器 数 为 O(n)。 我 们 已 经 证 明 R 至 多 含有 [log 站 个 
子 树 ， 每 一 个 子 树 互 不 相交 。 因 此 ， 根 据 定理 7-24，PROCESS(ij) 共 需 执行 时 间 O(log? n)， 处 
理 器 数 为 O(m? n)。 

定理 7-26 ”判定 UV 图 的 问题 是 NC 的 。 

证 明 : 算法 NC-UV(G) 第 1 步 利用 Klein 算 法 ，Klein 算 法 是 NC 的 ; 第 2 步 利 用 Klein 的 区 间 
图 判别 算法 ; 第 3 步 所 用 的 执行 时 间 为 O(log n)， 处 理 器 数 为 O(n log n); 第 4 步 中 , 第 4.3 ~ 4.6 
步 共 需 执行 时 间 O(log: n)， 处 理 器 数 为 O(m? mn?) (定理 7-23， 定 理 7-24 和 定理 7-25)。 第 4.1 ~ 4.7 
步 For 循 环 需要 执行 [log n] 次 。 因 此 该 算法 总 的 复杂 度 是 执行 时 间 为 O(log? n)，、 处 理 器 数 为 
O(m’)， 且 执行 CREW PRAM 模 型 。 
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第 8 章 搜索 与 合并 


8.1 串 行 搜索 


假定 4 = (ai,asya3,…say) 是 一 个 数据 数组 且 满足 a, < ww <…<a,。 给 定 一 个 元 素 x， 我 们 感 兴 
趣 的 是 求 出 数组 下 标 k 使 得 a:<x < aui。 在 串 行 计算 中 ， 既 可 以 对 每 一 个 [验证 w 和 au 的 值 ， 也 
可 以 使 用 二 分 搜索 技术 。 算 法 如 下 : 
算法 Sequential Search 
输入 : 1. 数据 数组 a, < a; <…<a， 
2 二 
输出 : 下 标 k 且 a <x< an 
1. Set ao = 一 oo and a,, = +% 
2. Fork=0tondo 
3.Ifa <xandx < a then return (Kk) 
else continue 
4. Nextk 
5. END 


上 面 的 串 行 搜索 方法 对 数组 的 数据 逐个 进行 比较 。 因 此 串 行 执行 时 间 为 CuD)。 下 面 的 二 
分 搜索 法 可 以 在 O(log n) 的 时 间 里 解决 搜索 问题 。 
算法 Binary Search 
输入 : 1. 数据 数组 w < a, < a; <*…<a, 
2<706 素 六 
输出 : 下 标 k 且 a <x < an 
Lao= 0 QH = +% 
left=1,right=n 
2. While left 《right repeat 
mid = [left + right]/2 
Case: 
<a: right= "mid 
X = anid: return (mid) 
XxX> awma: left = mid +1 
End Case 
3. End While . 
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4. return (right) 
$5.END 
为 了 演示 二 分 搜索 的 过 程 ， 我 们 以 数组 4 = (20,24,25 ,29,32,35,39,85) 为 例 ， 设 x = 22。 
初始 化 : left = 1,right = 8 且 mid = 4; 
比较 x = 22 和 am = 29， 
有 x < as。 因 此 ， 令 right = mid-1 = 3。 
迁 代 1: left= 1,right = 3 且 mid = 2; 
比较 x = 22 和 as = 24， 
有 x < as。 因此 ， 仿 right = mid-1 = 1。 
友 代 2: left = 1,right= 1 且 mid = 1; 
比较 x = 22 和 a,s = 20， 
有 XxX > ams。 因 此 、， 令 left = mid+l = 2。 
现在 有 left = 2, right = 1。 
While 循 环 left < right 不 满足 条 件 为 真 ， 
因此 While 循 环 结束 ， 返 回 right = 1。 
对 同一 个 数组 ， 我 们 在 下 表 中 用 另外 两 个 x 的 值 进一步 说 明 算法 的 执行 过 程 。 





8.2 CREW PRAM 模 型 下 的 并 行 搜 索 


252 在 CREW PRAM 模 型 里 面 ，wkx < a 的 验证 操作 可 以 对 所 有 的 k 值 同时 进行 。 即 处 理 器 Po 进 
行 a,<x < a 的 操作 ; 处 理 器 P, 进 行 a,<x< a 的 操作 ; 处 理 器 P, 进 行 a,<x < 4a 的 操作 ; 以 此 类 推 。 
验证 wkx < 4, 的 处 理 器 P 把 结果 i 写 人 全 局 变量 RESULT 中 。 算 法 如 下 : 
输入 : 1. 数组 A = (ai, a aa)，a<a<a< <an 
2. 值 x 
输出 : Result =k,，a; x < an 
0: ao = 一 2，Q =+% 
1: For k =0 to n do in parallel 
2: If a < x and x < a then 
set RESULT = 大 
endif 
3: End Parallel 
4: END 
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复杂 度 分 析 ”在 上 面 的 算法 中 ， 并 行 循环 需要 有 n+1 个 处 理 器 同时 执行 。 第 2 步 的 时 间 复 
杂 度 是 O(1)。 因 此 该 算法 需 0(n) 个 处 理 器 ， 可 以 在 0(1) 的 时 间 内 完成 。 由 于 数组 4 满足 条 件 a 
<q<q<…<a,， 只 有 一 个 处 理 器 能 够 在 第 2 步 成 功 设置 RESULT 的 值 ， 所 以 要 允许 绝对 写 操 
作 。 而 处 理 器 Pj 和 处 理 器 P; ,都 要 用 到 a,， 并 发 读 操作 是 必要 的 。 因 而 CREW PRAM 计 算 模型 
可 实现 该 算法 。 


8.3 更 多 数据 的 并 行 搜索 


当 数 组 的 长 度 比 处 理 器 的 数目 多 的 时 候 ， 上 述 算法 不 能 在 0(1) 时 间 内 完成 。 考 虚数 组 A = 
(qaqa,… yq) 其 中 a < a < a; < …< a,。 给 定 一 个 值 x?， 处 理 器 数目 为 p。 我 们 下 面 对 二 分 搜索 
法 进行 扩展 。 

在 二 分 搜索 中 ， 整 个 数组 被 分 成 两 个 子 数组 ， 数 组 的 中 间 元 素 与 x 进行 比较 。 在 本 节 我 们 先 
把 数组 分 成 p+1 个 几乎 大 小 相同 的 子 数组 并 比较 由 此 得 到 的 p 个 内 值 。 为 了 方便 起 见 ， 假 定 n = 
(p+1)r。 因 此 ， 当 把 数组 分 成 p+1 个 子 段 时 ， 每 一 段 将 有 r 个 元 素 。 


dr+l dr+2 .- .22r - Cpr+1… ln 
段 1 段 2 段 (p+1) 
R,=0 x=a, 
= 一 】 a <X 
=+1l x <a, 
如 果 R， = 0， 那么 返回 值 i*r。 如 果 对 所 有 的 i 有 RR 0, 那么 选择 满足 R,， = -1HR,= +1 条 
件 的 第 k 段 ， 则 x 将 落 在 第 k 段 内 。 在 第 k 段 重复 上 述 过程 。 该 算法 正式 给 出 如 下 : 
算法 Parallel Search 
输入 : 1 . 数组 4 三 (a, C2， 0 1) 
2. 值 x 
输出 : 下 标 K 且 a XA 


1.p is the number of processor variable. If n < p then use the algorithm Search-CREW 
algorithm and solve O(1) time 
If n > p then without loss of generality assume that n = r(p+1) for an integer valuer 


ww fo 


.Fori= 1 top do in parallel 
Case: 
a,= XiR;=0 
a < XR=-1 
a> XR=+1 
End case 
. End Parallel 
. Fori= 1 top do in parallel 
If R,=0 then 
return (i * r) 
End if 


mn 人 








6. End Parallel 

7. Set Ro = -1 and R,,.=!1 

8.Fork=1topt+ | doin parallel 

9.If R= +1 and R,,= ~] then choose 
the kth segment (ar，aurto ar) and do the search operation recursively on this 
segment 
Endif 

10. End Parallel 

11. END 

在 上 述 算法 中 ， 每 执行 一 个 递归 步 ， 问 题 的 规模 就 以 p+1 的 因子 减 小 。 
8.4 无 序数 组 搜索 


设 4 = (oa … am) 是 一 个 没有 排序 的 数组 。 给 定 一 个 数 x， 我 们 的 问题 是 求 出 满足 w = x 的 
数组 的 下 标 k。 如 果 注 足 条 件 的 k 不 存在 ， 那 么 返回 的 结果 是 n+1。 以 下 是 解决 此 问题 的 串 行 
法 。 

算法 Unsorted Search 

输入 : 1. 数组 A = (ai, a;, a;,…, a,) 


2. 值 x 
输出 : 下 标 k 且 a = zx。 如 果 役 有 这 样 的 存在 则 返回 +1 
1l.k=0 


2. Fork=1 tondo 

3.If a, = x then exit for loop 

4. Next k 

5. return (kK) 

6. END 

在 品行 计算 机 上 ,该 算法 可 以 在 0(n) 的 时 间 内 完成 。 它 可 以 直接 并 行 化 。 第 2 ~ 4 步 的 for- 

next 循 环 可 以 转换 成 并 行 循环 。 如 果 使 用 O(n) 个 处 理 器 ， 这 样 得 到 的 并 行 算法 可 以 在 0(1) 的 时 
间 内 完成 。 


8.5 秩 合并 


如 果 4 = (qi,a243… a) 和 B = (bi,b2,b;…,b,) 是 两 个 有 序 的 数组 ， 合 并 数组 4 和 B 意 味 着 形成 
一 个 新 的 包含 A 和 B 的 (m+n) 个 元 素 的 有 序数 组 。 例 如 ，A = (2,4,11,12,14,35,953,99), B= 
(6,7,9,25,26,31,42,85,87,102,105)， 合 并 两 个 数组 后 得 到 的 新 数组 C = (2,4,6,7,9,11,12,14,25,26， 
31,35,42,85,87,95,99,102,105)。 

串 行 合并 算法 通过 遍历 两 个 数组 ， 把 数组 元 素 存 到 C 中 。 开 始 的 时 候 ， 我 们 应 该 让 指针 ; 
指向 数组 4 的 第 一 个 元 素 ， 指 针 j 指 向 数组 8 的 第 一 个 元 素 。 即 i = 1 且 / = 1。 将 要 存 人 元 素 的 数 
组 C 的 下 标记 为 。 比 较 aj 和 b;:， 其 中 小 的 一 个 存 人 ct。 相 应 的 指针 指向 下 一 个 元 素 。 该 捉 行 算 
法 如 下 所 示 : 
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串 行 算法 Merge 
输入 : 大 小 分 别 为 nm 和 x 的 有 序数 组 4 和 8B 
输出 : 合并 的 有 序数 组 C = (cl ca co cn) 
1l.Set a = b=+% 
2. Seti=1,j= 1,k=1 
3. Whilek < m+n do 
4. If a, < b, then 
c=aandi=itl 
else 
c=b,andj=j+l 
endif 
5S.k=k+l1 
6. End while 
7. END 
上 面 的 串 行 算法 可 以 在 Ol(m+n) 的 时 间 内 完成 。 它 是 内 在 串 行 的 。 为 了 将 其 并 行 化 ， 我 们 
先 介 绍 一 些 符 号 。 设 A = (aaz0 aa 和 有 = (bi,b,,b3…,b,) 是 两 个 数组 ，x 表 示 一 个 数 。 我 们 定 
义 rank(x:4) 为 数组 4 中 小 于 等 于 x 的 元 素 个 数 。 设 4 = (2,4,11,12,14,35,95,99),，B = (6,7,9,25 ,26， 
31,42,85,87,102,105)， 那 么 rank(6:A) = 2, rank(7:A)=2, rank(9:A) = 2, rank(25:4) = 5 。 
我 们 进一步 定义 rank(B:A) 为 数组 (ri,72,73…,r,)， 其 中 x; = rank(b;:A)。 对 上 面 给 出 的 数组 4 
和 和 B: 
rank(B:A) = (2,2,2,5,5,5,6,6,0,8,8) 
rank(B:B) = (1,2,3,.4,5,6,7,8,9,10,11) 
rank(A:B) = (0,0,3,3,3,6,9,9) 
rank(A:A) = (1,2,3,4,5,6,7,8) 
rank(x:4 U B) 是 4 U 8B 中 小 于 等 于 x 的 元 素 个 数 。 衣 此 当 4 和 8B 交集 为 空 集 时 ,rank(x:A U 
B) = rank(x:A)+rank(x:B).。 
rank(A:A U B) = (1,2,3,4,5,6,7,8)+(0,0,3,3,3,6,9.,9) 
= (1,2,6,7,8,12,16,17) 
rank(B:A U B) = rank(B:A)+rank(B:8B) 
= (2,2,2,5,5,6,6,6,8,8)+(1,2,3,4,5,6,7,8,9,10,11) 25 
= (3,4,5,9,10,11,13,14,15,18,19) 


-a 


我 们 有 
rank(A:A U B) = (1,2,6,7,8,12,16,17) 
rank(B:A U B) = (3,4,5,9,10,11,13,14,15,18,19) 
从 上 面 的 两 个 数组 中 ,可 以 发 现 每 一 个 数组 元 素 在 数组 C 中 的 最 后 位 置 。 由 rank(4:A U 万， 
可 以 看 出 rank(a;:4 U B) = 8。 这 表示 在 数组 4 U 8 中 有 8 个 元 素 小 于 或 等 于 a;。 所 以 ，a 一 定位 
于 合并 后 的 数组 C 中 的 第 8 个 位 置 。 相 似 地 ， 由 于 rank(as:4 U B) = 12，ao 会 赋值 给 C1,。 如 果 RA 
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= rank(A:A U B) = (1,2,6,7,8,12,16,17)， 那 么 有 C(RA,) = 4 。 举 例 来 说 : 
C(1)=a=2, C(2) = a, = 14， C(6)=a;= 1] 
C(7) = as = 12, C(8)= a;= 14， C(12) = ae = 35 
C(16)=a;=95, C(17)=a,=99 
如 果 RB = rank(B:A U B)， 那 么 有 C(RB) = 有。 
RB = rank (B:A U B) = (3,4,5,9,10,11,13,14,15,18,19)。 因 而 有 
C(3)= b=6,， C(4) = b,=7,， C(5)=b;=9 
C(9)=b=25, C(10)=b;=26, C(11)=bs=31 
C(13)=b,=42, C(14)=b;=85, C(15)=b, = 87 
C(18) = po= 102，C(19) = b= 105 
该 算法 正式 表述 如 下 : 
算法 Merging and Ranking 


输入 : 1. 数组 A = (al ,am…a,al<as<a<……<an 
2. 数组 B= (6b,,b,,…,b,),bi<b<bs< <b, 


输出 : 合并 的 数组 C = (C(1), C(2), C3),…Clm+n)), C(1) < CC2) < C(3)…< Clm+n) 


.For i E {1,2,.°,m} and jE {1,2,,n} do in parallel 

. Find rank (a;:A) and Find rank (b,:2B) 

. Find rank (a,:B) and Find rank (b,:A) 

. End parallel 

. Denote rank (4:B) and rank (B:A) as explained earlier 
. RA = rank (A:A) + rank (A:B) 

. RB = rank (B:A) + rank (8:B) 

For i= 1 to m do in parallel 

C(RA) = 4， 

.End parallel 


一 ”一 
一 OO 


. For i= 1 to n do in parallel 
. C(RB) = B, 

. End parallel 

14. END 


et 
ww CD 


复杂 度 分 析 ”由 于 4 和 B 是 有 序数 组 ， 我 们 可 以 用 二 分 搜索 法 利用 一 个 处 理 器 在 O(log m) 
时 间 内 完成 求 rank (x:A)。 相 似 地 ， 求 rank (x:8) 可 以 在 O(log 站 时 间 内 完成 。 所 以 ， 第 1~ 4 步 
需 用 O(m+ 门 个 处 理 器 ， 在 O(log nn) 时 间 内 完成 (假定 a> m)。 第 8 ~ 10 步 和 第 11 ~ 13 步 用 O(n) 
个 处 理 器 可 以 在 O(1) 时 间 内 完成 。 所 以 该 算法 需 用 O(m+n) 个 处 理 器 ， 在 O(log ) 时 间 内 完成 。 
第 2 ~ 3 步 涉及 并 发 读 操 作 ， 而 绝对 写 操作 也 是 必要 的 。 因 此 ， 该 算法 可 以 在 CREW PRAM 


模型 中 实现 。 
8.6 双 调 合并 


如 果 存 在 两 个 整数 /和 使 得 (cam20 和 (aunmauasm……G) 是 两 个 单调 序列 ， 一 个 单 
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调 上 升 ， 另 一 个 单调 下 降 ， 那么 我 们 称 数 组 A = (aoyaiy4;,…,aii) 为 双 调 数组 或 双 调 序列 。 例 如 ， 
序列 4 = (22,27,39,48,42,40,35,34,32,25,24,18,8,5,7,14) 是 一 个 双 调 序列 。 为 了 便于 理解 ， 此 序 
列 如 下 表 所 示 : 

J 大 


过 J 
os | 
[a0 [2 [mls le lolss lll ll |s | 5 | 7 | 14| 

如 果 我 们 把 这 些 数 沿 着 一 个 圆圈 的 周边 排列 ， 那 么 这 些 数 可 以 分 成 两 部 分 : 一 部 分 单调 
上 升 ， 另 一 部 分 单调 下 降 。 








设 4(0:2n-1) 为 一 双 调 序列 。 我 们 定义 : 
L=Min{aa} Oi<xn 
R=Max{a,as} Oi<n 


则 有 如 下 的 结论 : 

1. LL,…,L, 是 一 个 双 调 席 列 ; 

2. RuRR:… 及 是 一 个 双 调 序列 ; 

3. 每 一 个 上 都 小 于 或 等 于 R。 

为 了 说 明 这 一 点 ， 考 察 本 节 所 用 的 数组 4。 


0 
2 
3 
4 
5 
6 
7 
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上 面 的 结果 被 用 于 合并 两 个 有 序数 组 。 我 们 可 以 进行 如 下 操作 : 

1. 设 A(0:n-1) 和 B(0:n-1) 是 两 个 有 序数 组 。 把 数组 B 反 转 ， 即 (bo,b1,b,… ,bt) = (bb 
bbi,bo)。 现 在 4A(0:n-1) 是 单调 上 升序 列 ，B(0:n-1) 是 单调 下 降序 列 。 那 么 我 们 可 以 用 数组 8 扩 
展 数 组 A4， 即 A(n:2n-1) = B8(0:n-1)。 由 此 ，A4(0:2n--1) 是 双 调 序列 。 

2. 对 i = 0,12,…,(n-1), 进行 如 下 的 操作 

a; = Min{fa ,Ga } 
am = Max{ai,ann} 

该 操作 可 以 通过 下 面 的 “这 ”语句 完成 : 

if ai > a,, then interchange a, and a,,, 

通过 这 些 操作 ， 我 们 得 到 : 

(Po = (Qosl1,G2,** 41) 
(RoRi Re RD = (dln yl ,G2n-1) 

因而 有 如 下 的 结论 : 

1. A(0:n 一 1) 为 一 双 调 序列 ; 

2. h(n:2n-1) 为 一 双 调 序列 ; 

3., 对 0 < i <n 和 n <j < 2n-1， 每 一 个 a 都 小 于 等 于 a,。 即 A(0:n-1) 的 每 一 个 元 素 都 小 于 等 于 

A(n:2n—1)。 

基于 上 面 的 结论 ， 子 数组 A4(0:n 一 1 和 A(n:2n 一 1) 可 以 分 别处 理 。 这 样 ，4(0:2n-1) 将 给 出 最 
后 的 合并 数组 。 下 面 正式 给 出 算法 描述 。 

算法 Bitonic-Merge 

输入 : 有 序 序列 A(0:n-1) 和 B(0:n--1) 

输出 : 合并 的 序列 4(0:2z-1) 

1. Copy A(n:2n-—1) = B(0:n—1) 
2. For i=0 ton-l do in parallel 
3.1f a,> athen 
Interchange a; and ai。 
Endif 
4. End parallel 
5. Do the above operations recursively on A(0:n—1) and A(n:2n—1) separately in parallel 
and make them sorted sequence 
6. End 
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复杂 度 分 析 在 第 2 ~ 4 步 ，O(0D 个 处 理 器 可 以 在 O(D 时 间 内 完成 。 每 一 次 迭代 ， 数 组 的 大 
小 减 半 ， 所 以 一 共有 O(log 门 个 递归 步 。 因 此 ， 在 EREW PRAM 模 型 中 ， 此 算法 可 以 在 O(n) 个 
处 理 器 上 用 O(log n) 的 时 间 完 成 。 
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第 9 章 排序 算法 


排序 一 般 是 按 某 种 顺序 把 事物 进行 排列 。 把 文件 中 的 记录 Ri,R,…,R, 进行 排序 就 是 为 符号 
1,2,…,n 确 定 一 个 置换 i， 使 得 对 i = 1,2,…,n-1 有 kanop< ow 成 立 ， 其 中 的 是 记录 RR 的 键 值 。 如 
果 A4 是 一 个 数组 ， 那 么 4s,< Axo… < hx。 除了 一 般 的 商业 应 用 ， 排 序 还 有 很 多 应 用 领域 ， 下 
面 我 们 给 出 一 些 例子 : 

“假定 有 10 000 个 随机 样本 且 其 中 很 多 是 相同 的 。 我 们 的 目的 是 要 将 其 重新 排列 ， 使 得 所 

有 相同 的 值 相 邻 。 此 问题 称 为 “归属 ”(togetherness) 问题 。 

。 搜 寻 某 个 特别 的 记录 只 有 在 文件 中 记录 排序 的 情况 下 才 比 较 容 易 。 

。 计 算 机 使 用 中 的 “文件 编辑 ”操作 。 

*。 计 算 机 制造 商 估计 超过 25% 的 计算 机 运行 时 间 被 用 来 进行 排序 运算 。 

排序 算法 的 复杂 度 ”排序 算法 的 复杂 度 是 参加 排序 的 记录 数目 的 孙 数 。 下 面 给 出 的 是 在 
排序 过 程 中 的 基本 操作 : 

1. 两 个 键 值 的 比较 ; 

2. 记录 的 交换 ; 

3. 在 一 个 临时 位 置 对 记录 进行 赋值 。 

正常 情况 下 ， 由 于 其 他 操作 的 次 数 几 乎 是 比较 次 数 的 常数 倍 ， 复 杂 度 函数 只 计算 比较 的 
次 数 。 在 学 习 并 行 排序 算法 之 前 ， 让 我 们 先 回顾 几 个 串 行 排序 算法 。 
9.1 串 行 排序 算法 

到 现在 为 止 ， 研究 者 设计 了 多 个 串 行 排序 算法 ， 其 中 冒 泡 排序 是 最 流行 的 。 
9.1.1 肾 泡 排序 

冒 泡 排序 是 常用 的 排序 方法 。 想 对 数 x,x,… x 进行 排序 ， 如 果 x; > x ， 则 交换 x 和 x,, ， 其 
中 i = 12… 大 ,大 = n,n-1,…,2。 因 而 比较 操作 的 次 数 为 : 

1+2+3+*…+(n—1) = n(n—1)/2 = O(n’) 

在 此 算法 中 ， 比 较 操作 的 次 数 和 数据 集合 无 关 。 冒 泡 排 序 是 最 简单 的 排序 算法 ， 而 且 可 

以 并 行 化 。 考 虑 有 8 个 数 的 久光 排序 
A, A! A, A; A A A, hj 

如 果 用 冒 泡 排 序 ， 则 先 比较 4c 和 A;， 然 后 是 4; 和 As。，Ahs 和 As;， 等 等 。 如 果 用 4 个 处 理 器 ， 那 

么 每 个 处 理 器 可 以 分 到 两 个 数 : 


po: Ag&AI Pi: A & A; P,: A4 &As P;: 46 区 47 


每 一 个 处 理 器 比较 自己 的 两 个 数 ， 如 果 需 要 就 进行 交换 。 即 处 理 器 P 进 行 如 下 操作 : 
如 果 A, > hz ， 那 么 交换 4 和 4 。 对 ;i = 0,1,2.3， 上 述 操作 在 4 个 处 理 器 中 并 行进 行 (我 
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们 称 为 第 0 步 )。 
在 下 面 一 步 (第 1 步 )， 用 3 个 处 理 器 且 数 的 分 配 如 下 : 
4 人文 4， A&A， A;&A, 
Po 已 PP, 
这 样 ， 每 个 处 理 器 比较 As,, 和 4A,,， 如 果 Az,, > hw,2， 那 么 交换 。 下 一 步 (第 2 步 )， 数 的 分 
配 又 一 次 出 现 和 第 0 步 相同 的 情况 ; 而 第 3 步 和 第 1 步 类 似 。 
此 并 行 算法 可 以 正式 表述 如 下 : 
算法 Bubble-Sort 
输入 : A(0:n--1) 
输出 : 有 序数 组 4(0:n-1) 
1. Fork=0ton-2 
2.If kis even then 
(a) for = 0 to (n/2)-1 do in parallel 
(b) If A,, > 4, then interchange them 
(c) End parallel 
Elise 
(d) For i = 0 to (n/2)-2 do in parallel 
(e) If 4 > Az, then interchange them 
(f) End parallel 
Endif 
3. Nextk 
复杂 度 分 析 ”第 1 ~ 3 步 循 环 体 的 执行 次 数 是 xn-1 次 ， 因 此 执行 时 间 为 0(n)。 第 2 步 中 ， 奇 
数 步 需要 (n/2)-2 个 处 理 器 而 偶数 步 需 要 (m12)-1 个 ， 所 以 需要 O(nm) 个 处 理 器 。 很 清楚 可 以 看 出 ， 
EREW PRAM 计算 模型 是 可 以 满足 要 求 的 。 


9.1.2 插入 排序 

如 果 前 面 几 个 记录 已 经 是 排序 的 形式 ， 那 么 未 排序 的 记录 可 以 插入 已 排序 的 记录 中 的 适 
当 位 置 。 此 方法 称 作 插入 排序 。 给 定数 4v4iv… 4,， 其 中 

4hAKA4AK…4 ,1<j<n 

此 方法 建议 在 4, 和 4, ,之 间 的 合适 位 置 插入 4,， 由 此 我 们 得 到 4A, < 4,<…< 4;。 上 面 的 假定 
在 给 定数 列 中 对 j = 2 是 成 立 的 ， 对 j = 2, 3,…, n， 重 复 上 面 的 步骤 ， 就 可 以 完成 排序 。 

下 面 是 插入 排序 的 串 行 算法 : 

算法 Insertion Sort 


BEGIN 
1. For j= 2,3,4,…n 
2.i=j-1l,T=A, 


3.If T>Ah,goto step 6 
4.A,,=A;i=i-l 
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5.1fi>0 goto step3 
6.A,;=T 
7.Nexty 

END 

总 的 计算 时 间 是 CC ， 因 此 这 并 不 是 一 个 好 的 算法 。 

对 直接 插入 排序 法 的 改进 ”直接 插入 涉及 两 个 基本 操作 : (i) 扫描 有 序数 列 41,4,,…,A,，， 
求 出 小 于 等 于 4 的 最 大 数 ; (ii) 在 特定 的 位 置 插入 4。 在 最 坏 的 情况 下 ，4, 和 4 之 间 的 扫描 
需要 /个 比较 。 如 果 采 用 二 分 搜索 技术 ， 可 以 减少 到 log j 个 比较 。 但 是 如 果 想 减少 插入 的 时 间 ， 
给 定数 列 的 数据 结构 必须 改变 。 如 果 采 用 列表 数据 结构 ， 就 不 能 用 二 分 搜索 技术 扫描 有 序列 
表 ， 因 此 不 能 提高 总 的 计算 时 间 。 


9.1.3 Shell 递 减 步 长 排序 


如 果 每 一 对 数 都 进行 比较 并 排序 ， 那 么 总 的 排序 时 间 不 可 能 比 0(n’) 少 。 因 此 考虑 其 他 的 
技术 是 必要 的 。Shell 于 1959 年 提出 了 一 个 新 的 排序 技术 ， 被 称 为 递减 步 长 排序 法 。 
先 给 定 一 个 整数 步 长 | (0 < h<n)， 然 后 把 给 定 的 数 分 成 h 个 集合 ， 如 下 所 示 : 
集合 1 = {4 44)} 
集合 2 = {4;,A12,Azr2,…} 


集合 h= {4A424} 
每 一 组 集合 用 直接 插入 排序 法 进行 排序 ， 然 后 把 步 长 p 减 小 ， 重 复 前 面 的 步 又 。 对 逐渐 减 
小 的 步 长 有 ,hi,h3… ,有 ,hh 进行 上 面 的 操作 ， 最 后 完成 排序 。 这 意味 着 n < h<h <h'<h 
<h,<h =1。 此 算法 如 下 所 示 : 


算法 Shellsort 
1.Fors = 1 二 1 ,3,2,1 do 
2.h=h, 
3.Forj=h+ltondo 
4.i=j-h:T=Ah, 
5.If A,«T then go to step 8 


6. 4 = A;i=i-h 
7.1fi>0 goto step5 
8.4,,=T 

9. Next J 

10. Nexts 


复杂 度 分 析 下 面 是 此 算法 的 一 些 参 数 : 

1. 1， 步 长 个 数 ; 

2. 步 长 hh, hy,, hs,h,, hi=1。 

对 计算 时 间 的 分 析 会 引出 一 些 很 吸引 人 但 目前 尚未 解决 的 数学 问题 ， 对 很 大 的 N， 没 有 人 
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能 确定 可 能 最 好 的 步 长 序列 。 

Hunt 仅 仅 考 虑 了 两 个 步 长 ， 结 果 表明 计算 时 间 为 O(n”)。 对 直接 插入 排序 的 O(n) 计算 时 
间 而 言 ，O0x9) 已 经 是 很 大 的 改进 。 由 于 对 比较 小 的 W (如 16)， 直 接 插入 排序 是 最 好 的 方法 ， 
我 们 选 定 h = NM16 并 且 对 不 同 的 N 运 行 Shel 的 算法 。 我 们 记录 了 计算 时 间 并 分 析 了 所 得 到 的 变 
化 图 。 

如 果 步 长 h, hi, P 2…, 有 ,有 ,hh 对 s = 2,3,…, 1 满足 h-, 可 整除 h;,， 我 们 说 步 长 序列 满足 整除 
条 件 。 计 算 时 间 不 可 能 小 于 O(n”*)。Papernov 和 Stasevich 的 研究 表明 ， 如 果 对 s = 2,3，…,:， 整 
除 条 件 不 能 满足 ， 那 么 Shell 的 算法 会 更 有 效 。 步 长 h, = 2 (s = 1,2,3,…,f) 满足 整除 条 件 ， 而 
有 =2 一 1 (s = 123,…) 则 不 满足 。 

Pratt 在 1969 年 发 现 了 对 这 一 问题 的 改进 。 如 果 所 选择 的 步 长 都 是 2p39 且 比 N 小 的 形式 ， 那 
么 计算 时 间 为 O(N(log N)”))。 只 有 在 N 很 大 的 情况 下 才能 改进 效率 。 

1971 年 ， 斯 坦 福 大 学 的 Peterson 和 Rusell 对 选择 Shell 算 法 的 步 长 进行 了 大 量 的 实验 。 他 们 
采用 了 很 多 步 长 的 经 验 值 。 经 验 值 当然 不 能 穷尽 所 有 的 可 能 性 ， 他 们 没有 发 现 选 择 最 好 的 步 
长 序列 的 有 力 论 据 。 一 般 下 面 的 步 长 选择 方法 被 认为 能 够 使 Shell 算 法 更 有 效率 。 设 h, = 1， 
hw = 3h+1， 直 到 h+22n 时 停止 。 


9.1.4 堆 排 序 


本 节 我 们 学 习 一 种 新 的 能 够 允许 向 一 个 集合 插入 数据 并 高 效 求 出 最 大 数 的 数据 结构 。 允 
许 上 述 两 种 操作 的 数据 结构 称 为 优先 队列 (priority queue )。 很 多 算法 需要 用 到 优先 队列 ， 因 
此 实现 这 些 操作 的 高 效 方法 会 很 有 用 。 由 于 可 以 高 效 插 入 新 数据 ， 我 们 首先 想到 的 也 许 是 队 
列 ; 但 是 求 出 最 大 的 数据 却 需 要 扫描 整个 队列 。 另 外 一 个 建议 是 采用 串 行 存放 的 有 序 链表 。 
但 是 插入 操作 需要 把 整个 链表 的 所 有 数据 移动 一 遍 。 我 们 需要 能 够 高 效 进行 上 述 两 种 操作 的 
数据 结构 。 

堆 是 每 一 节点 的 值 至 少 大 于 等 于 其 子 节点 的 值 (如 果 存 在 ) 的 完全 二 又 树 。 此 定义 暗示 
堆 的 根 结 点 的 值 就 是 最 大 值 。 如 果 所 有 的 数据 各 不 相同 ， 那 么 根 结 点 包含 最 大 的 数据 。 

大 于 等 于 关系 可 以 取 反 ， 使 得 父 节点 包含 的 数据 至 少 小 于 子 节点 。 这 时 ， 根 节点 包含 最 
小 的 数据 。 但 是 由 于 历史 传统 的 原因 ， 我 们 假定 越 大 的 数据 越 接近 根 。 因 此 可 以 通过 移动 
数据 的 位 置 并 保留 二 叉 树 的 结构 使 得 任何 存在 某 种 顺序 的 二 又 树 满足 堆 的 性 质 。 然 而 ， 经 
常 遇 到 的 情况 是 : 给 定 na 个 数据 ， 如 zz 个 整数 ， 我 们 可 以 自由 选择 任意 形状 看 上 去 最 合理 的 
二 叉 树 。 在 这 种 情况 下 .我们 可 以 选择 完全 二 叉 树 。 这 也 是 我 们 在 堆 的 定义 中 坚持 用 完全 
二 又 树 的 原因 。 

现在 考虑 给 定 在 4A(1:n) 中 的 n 个 整数 如 何 形成 堆 。 一 种 策略 是 确定 怎样 把 一 个 数据 插入 已 
经 存在 的 堆 中 。 如 果 可 以 完成 这 一 操作 ， 那 么 我 们 可 以 应 用 该 算法 za 次， 首先 把 数据 插入 一 个 
空 堆 里 ， 然 后 继续 重复 操作 直到 所 有 n 个 数据 都 插 完 。 解 决 方法 很 简单 ， 可 以 先 把 一 个 新 数据 
放 到 堆 的 “底部 ”， 然 后 将 该 数据 和 它 的 父 节 点 、 祖 父 节点 、 曾 祖父 节点 等 比较 ， 直 到 它 小 于 
等 于 其 中 的 一 个 节点 为 止 。 过 程 INSERT 描述 了 这 一 过 程 的 全 部 细节 。 


过 程 INSERT ((A,n)) 
jn 
ic [n/2] 


上 
[oa 
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item = A(n) 

while i> 0 and A(i) < item do 

AQ) = A(i)// move the parent down 

joi 

ic [i/2] // the parent of A(i) is at A([i/2]) 
End while 

AQ) = item // a place for A(n) is found 


从 描述 可 以 很 清楚 地 看 出 ，INSERT 的 时 间 会 变化 。 在 最 好 的 情况 下 ， 新 的 数据 一 开始 就 
被 放 在 正确 的 位 置 ， 不 需要 移动 任何 数据 。 在 最 坏 的 情况 下 ，while 循环 的 次 数 和 堆 的 层 数 成 
正比 。A(1:n) 中 的 n 个 数据 可 以 通过 下 面 的 程序 段 转换 成 一 个 堆 ( 即 完全 二 又 树 )。 
fori~2tondo 
Call INSERT (A,) 
End do 


复杂 度 分 析 ”在 INSERT 过 程 中 ， 生 成 维 的 数据 集合 最 坏 是 把 数据 按 升序 插入 。 每 一 个 新 
的 数据 都 会 上 升 变 成 新 的 根 节点 。 

对 于 1< i< [log(n+1)] 的 完全 二 又 树 ， 其 第 i 层 最 多 有 2! 个 节点 。 对 一 个 在 第 i 层 的 节点 ， 其 
到 根 节点 的 距离 为 -1。 因 此 用 INSERT 过 程 生成 堆 的 最 坏 情 况 下 的 时 间 复 杂 度 为 O(n log n)。 

一 个 关于 INSERT 的 令 人 惊奇 的 事实 是 对 "个 随机 输入 数据 ， 其 平均 复杂 度 比 最 坏 的 情况 
要 快 ， 接 近 O(a 而 不 是 O(a log n)。 这 表示 每 一 个 新 的 数据 只 是 引起 常数 次 的 数据 移动 。 证 明 
INSERT 的 这 个 性 质 很 复杂 ， 因 此 我 们 在 此 不 给 出 证 明 。 

另外 一 个 生成 堆 的 算法 具有 很 好 的 性 质 ， 即 其 最 坏 的 情况 比 n-1 次 的 INSERT 调 用 快 一 个 
数量 级 。 这 种 减少 通过 采用 把 4(1:n) 看 作 完 全 二 又 树 ， 并 从 树 的 叶 结 点 到 根 节点 逐 层 进行 操作 
的 算法 达到 。 在 每 一 层 ， 左 右 子 树 都 有 可 能 不 符合 堆 的 性 质 。 因 此 给 出 一 种 把 只 有 根 节 点 不 
符合 堆 性 质 的 二 叉 树 转换 成 堆 的 方法 就 足够 了 。 过 程 ADJUST 就 是 为 根 在 位 置 ;的 子 树 进行 这 
一 操作 的 算法 。 这 一 算法 假定 此 二 又 树 为 前 面 讨论 的 二 又 树 的 子 树 。 

过 程 ADJUST ((A, i, n)) 

/* 根 在 A(2*i) 和 A(2*+1) 的 完全 二 叉 树 与 4 让 结合 生成 一 个 简单 堆 ，1 < i<n。 古 点 值 在 1 和 
nn 之 间 */ 

j= 2* 
item ~ A(7?) 

while jz do 
Ifj<nand AQ)« AG+I) then 
j=j+tl 

endif 

If item > AQ) then 
exit while 

else 
A(L/2]) = AQ) 
j= 2*] 
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endif 
End while 
A(Lj/2D) ~ item 
END 
给 定 A(1:n) 中 的 rn 个 数据 ， 我 们 可 以 通过 调用 ADJUST 生 成 一 个 堆 。 很 容易 看 出 叶 节 点 
已 经 是 堆 。 因 此 我 们 可 以 把 叶 节 点 的 父 节 点 调用 ADJUST 作 为 开始 ， 然 后 逐 层 上 升 ， 直 到 
根 节点 。 
过 程 HEAPIFY 
BEGIN 
fori= [n/2] to 1 by step -1 do 
call ADJUST (A,i,n) 
Next i 
END 
我 们 已 经 把 堆 作 为 一 种 每 一 节点 至 少 不 小 于 其 子 节 点 的 数据 结构 进行 了 讨论 。 现 在 我 们 
给 出 利用 堆 数 据 结构 进行 排序 的 算法 : 
过 程 Heapsort((A, n)) 
call HEAPIFY 
for i=n to 2 by step -1 do 
t= A(Q) 
A(D) = A(1) 
A(1)=t 
call ADJUST (A,i~—1) 
Nexti 
虽然 只 需要 调用 O(n) 次 HEAPIFY ，ADJUST 的 每 一 次 调用 可 能 需要 O(log nn) 次 操作 。 因 此 
最 坯 情况 下 的 时 间 复 杂 度 为 O(n log n)。 注 意 对 存储 的 需求 ， 除 了 4(1:n) 外 ， 仅 针对 一 些 简 单 
变量 。 


9.2 合并 排序 


合并 可 以 有 效 地 应 用 于 排序 。 考 虑 数组 x(1:n)， 如 果 单 独 把 ,看 作 一 个 数组 ， 那 么 该 数组 
是 已 排序 的 ;对 于 也 一 样 。 那 么 ， 我 们 现在 可 以 合并 数组 x, 和 x,， 得 到 已 排序 的 数组 x,x,。 
相似 地 ， 可 以 合并 已 排序 的 数组 x,xz 和 x，x， 得 到 已 排序 数组 x, x xs x。 

我 们 以 16 个 数 的 数组 为 例子 来 进行 说 明 : 


lw sl ol ol | 


成 对 进行 合并 : 








3531lm| si|s|j%|r0lo 





合并 x, 和 x,， 得 到 y2 
合并 x 和 xs， 得 到 y; y 





[4 
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合并 xs 和 xie， 得 到 y's yis 






得 到 下 面 的 表 : 
ED 
llsolslnl wiol ol ls "mim lw| lo 

成 对 进行 合并 : 


合并 y， yz 和》 y4， 得 到 xz x Xs Xa 


ya 和 yw 16， 得 到 xis xia xs xn6 
我 们 得 到 下 面 的 数列 : 71， 83, 85, 19, 23, 64, 36, 48, 53, 87, 0, 8, 10, 96。 
继续 进行 合并 ， 最 后 得 到 个 简单 的 有 序数 列 。 进 行 合 并 的 数组 对 的 选择 方 法 可 以 改进 以 加 快 
排序 进程 ， 并 为 进一步 的 改进 创造 条 件 。 改 进 的 数组 对 的 选择 方法 可 以 是 (xX)，(X2%,-1)，: 
排序 的 元 素 分 别 存储 为 (六 )，(y)，…。 此 方法 叫做 直接 合并 排序 ， 其 特点 是 每 次 合并 
的 数组 元 素数 目 是 预先 确定 的 ， 即 1,2,27,2,2',…， 因 而 合并 迭代 的 次 数 为 log n。 如 果 合 并 操 
作 并 行 执 行 ， 在 CREW PRAM 模 型 下 ， 我 们 可 以 在 O(log’ n) 的 时 间 内 完成 排序 。 


9.3 排序 网 络 


Knuth 发 现 超过 25% 的 CPU 时 间 用 在 排序 上 。 排 序 已 经 变 得 如 此 重要 ， 因 此 ， 现 在 是 考虑 
用 专用 硬件 实现 数据 排序 功能 的 时 候 。 本 节 我 们 假定 两 个 基本 排序 硬件 可 以 对 两 个 数据 进行 
排序 。 这 在 图 9-1 中 给 出 。 


x Max {x,y} x Min {x,y} 
y Min {x,y} y Max {x,y} 
向 上 排序 网 络 向 下 排序 网 络 


图 9-1 基本 排序 网 络 


如 果 要 对 四 个 数 x,,x,,xsx 进 行 排序 ， 可 以 用 基本 排序 网 络 设计 一 个 新 的 排序 网 络 。 如 图 
9-2 所 示 。 





图 9-2 对 四 个 元 素 进行 排序 的 排序 网 络 
在 图 9-2 中 ，x, 和 x; 用 基本 排序 网 络 B, 进 行 排序 ， 同时 用 另外 一 个 基本 排序 网 络 B 对 x, 和 x。 
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进行 排序 。B, 和 B, 较 大 的 输出 元 素 用 8B, 进行 排序 ; 8B, 输 出 的 较 大 元 素 很 明显 是 最 大 的 元 素 ， 称 
作 xs; B, 和 B, 较 小 的 输出 元 素 用 Bs 进行 排序 ;8, 输 出 的 较 小 元 素 很 明显 是 最 小 的 元 素 ， 称 作 
x; B; 较 小 的 输出 元 素 和 B, 较 大 的 输出 元 素 用 Bs 排序 ， 称 作 x, 和 xs。 因 此 输出 的 数组 (x, x,x;x,) 
是 已 排序 的 数组 。 
双 调 排序 网 络 ”如 果 4(0:n-1) 是 双 调 数列 ， 那 么 可 以 像 双 调 合并 一 样 对 它 进行 排序 。 当 
A(0:n-1) 是 给 定 的 双 调 数列 时 ， 我 们 可 以 考虑 下 面 的 两 个 子 数列 : 


/0.2 

A0:- 1 
和 

/下 

公元 : 1 
设 


L = Minla,a | 0<i<2 
it 了 2 

.1 

R -Maxlaa.s 0ci<— 
i 2 


正如 我 们 已 经 研究 过 的 ，L 和 R 会 各 自 形成 一 个 双 调 数列 有 的 每 一 个 元 素 都 小 于 等 于 R。 
如 果 L 和 RR 分别 进 行 排序 ， 把 R 的 输出 放 在 L 后 面 ， 我 们 将 得 到 已 排序 的 数列 。 

能 够 对 有 n 个 元 素 的 双 调 数 列 进行 排序 的 网 络 (用 B(n) 表 示 )， 称 作 大 小 为 x 的 双 调 排序 网 
络 。 正 如 上 面 所 解释 的 ， 双 调 排 序 网 络 8(n) 可 以 用 两 个 8B(n/2) 的 双 调 排序 网 络 和 一 些 基本 排序 
网 络 来 设计 ， 双 调 排序 网 络 8(8) 在 图 9-3 中 给 出 。 





图 9-3 双 调 排序 网 络 B(8) 
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习题 
9.1 证 明和 任意 双 调 数列 满足 惟一 交 又 属性 (unique crossover property )。 
9.2 设 X 为 一 数组 。 设 计 并 行 算法 用 % 划 分 数组 ， 使 得 划分 后 x, 存 在 所 在 的 位 置 ， 且 新 的 
数组 元 素 X0x1 x,… X, 满 足 
思科 JS 天 
XX, jk 
9.3 设计 快速 排序 算法 的 非 递 归 版 本 。 
9.4 画 出 对 具有 64 个 元 素 的 数组 进行 排序 的 排序 网 络 。 
9.5 在 长 度 是 2 的 双 调 数列 中 ， 求 出 具有 惟一 交叉 属性 的 水 平 切 割 所 需要 的 比较 操作 的 
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10.1 代数 方程 


考虑 代数 方程 Kx) = 0。 如 果 fla) 和 f(b) 符 号 相反 ， 那 么 在 a 和 4b 之 间 存 在 一 个 根 。 例 如 方程 
xX:—3x+2=0 
f0)=2 正 的 
及 1.$) = -0.25 负 的 
因此 ， 方程 *-3x+2 = 0 在 0 和 1.5 之 间 有 一 个 实 根 。 


10.1.1 几何 解释 


考虑 方程 fx) = 0， 我 们 在 二 维 平面 内 画 出 曲线 y = AD 。 曲 线 与 x 轴 的 交点 就 是 方程 Ko = 0 
的 根 。 例 如 方程 -3x+2 = 0， 相 应 的 曲线 y = 2-3x+2 在 图 10-1 中 给 出 。 


图 10-1 曲线 y = 她 -3X+2 


图 中 曲线 与 x 轴 有 两 个 交点 : x = 1 和 x = 2。 这 两 个 交点 的 值 就 是 方程 -3x+2 = 0 的 根 。 
为 了 求 一 个 代数 方程 的 实 根 ， 人们 设计 了 多 种 迭代 法 。 这 些 方 法 从 根 的 一 个 近似 值 x 出 发 ， 
通过 近似 迭代 公式 求 得 一 个 比 x, 更 接近 根 x* 的 值 。 这 样 的 公式 叫 作 和 迭代 公式 ， 其 形式 为 
Xi 三 xb。 
通过 代入 k = 0,1,2,…， 根 的 近似 值得 到 逐步 改进 ， 并 在 精度 达到 要 求 的 情况 下 终止 这 一 
过 程 。 下 面 给 出 几 种 迭代 法 : 
解 方程 o = 0 的 选 代 法 


人 


编 号 力量 法 迭代 公式 


= 


1 牛顿 - 拉 弗 森 方 法 Kin = Xfx) f(x) 
2 Von Mises 公式 Xiti 二 xi—f(x)/f (xo) 
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( 续 ) 
编 号 方 法 迭代 公式 
3 弦 法 或 割 线 法 Kin = XfXo) Xo f(xXON fxo) Ax)) 
4 试 位 法 xs = Ki fx -Xf Rx) AA) 
5 逐次 逼近 法 如 果 给 定 方程 Kx) = 0， 将 其 改写 成 x = @G0oD， 那 么 欠 代 公式 为 we = 四 (%) 


上 述 五 种 方法 是 内 在 串 行 的 。 另 外 一 个 称 作 对 分 法 的 选 代 法 可 以 发 掘 一 些 内 在 的 并 行 性 。 


10.1.2 ”对 分 法 


考虑 方程 Kx) = 0。a 和 b 是 两 个 点 且 f(a) 和 f(b) 符 号 相反 ， 那 么 在 a 和 5 之 间 ftx) = 0 有 一 个 根 。 
考虑 a 和 4b 间 的 中 点 : m= (a+b)/2。 
已 知 Ka) 和 f(b5) 符 号 相反 ， 如 果 fa) 和 flm) 也 符号 相反 ， 那 么 所 x) = 0 在 a 和 mm 之 间 有 一 个 根 。 
区 间 (a,m) 的 长 度 是 (a,b) 的 一 半 。 如 果 f(a) 和 flm) 的 符号 不 相反 ， 那 么 Rm) 和 A5) 符 号 相反 。 这 样 
根 在 m 和 b 之 间 。 
这 样 我 们 就 把 区 间 (a,b) 分 成 两 个 长 度 相同 的 子 区 间 (aym) 和 (Gm,b)， 而 且 在 其 中 一 个 子 区 间 
内 有 根 存 在 。 如 果 重复 这 一 过 程 ， 那 么 含有 根 的 区 间 长 度 每 次 都 减少 一 半 。 当 区 间 长 度 很 小 
的 时 候 ， 值 m 就 被 认为 是 方程 的 根 。 
我 们 先 给 出 这 一 问题 的 品行 算法 。 假 定 区 间 的 初始 值 4 和 5b 已 知 ， 且 fa) 和 f(5) 符 号 相反 
(Bhf(a) x fb) < 0)。 
算法 Bisection-SEQ 
BEGIN 
1. While la-bl > e do 
2.m= (a+b)/2 
3. If fa)fim) < 0 then 
b=m 
else 
da=m 
Endif 
4. End While 
5. Return (a+b)/2 
END 
在 这 里 ，* 是 结果 所 需要 的 精度 。 如 果 1/2" < elb-1g/12…， 算 法 Bisection-SEQ 的 While 循环 
重复 执行 4 次 。 下 面 的 算法 用 并 行 方式 来 确定 代数 方程 的 根 ， 并 要 用 到 CRCW PRAM 模 型 。 
假定 我 们 只 有 p 个 处 理 器 ,那么 区 间 (a,b) 被 划分 成 p 个 子 区 间 ， 每 个 子 区 间 分 配 一 个 处 理 
器 。 各 处 理 器 判断 根 是 否 落 在 自己 的 子 区 间 内 ， 并 把 恋 子 区 间 看 作 区 间 (a,b)。 这 样 做 可 以 提 
高 计算 时 间 p 人 和信。 算法 如 下 : 
算法 Bisection-PARALLEL-1 
输入 : 给 定 函 数 Ax)， 精 度 E 
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专 
压 


: 根 
While lIb~-al > do 
Xo=a 
. For i= 1 top do in Parallel 
Xi = Xoti(b—a)/p 
If fx;_ 1)f(x) < 0 then 
a = Xi 
b=x, 
endif 
. End Parallel 

10. End While 

11. root = (a+b)/2 

12. End 

复杂 度 分 析 ”算法 的 第 5 ~ 6 步 中 ,会 有 1 个 以 上 的 处 理 器 同时 对 a 和 5b 赋 值 。 因 此 ， 实 现 该 

算法 需要 允许 并 发 写 操作 的 PRAM 模 型 。z 的 值 既 会 被 第 ; 企 处理 器 用 到 ， 也 会 被 第 计 1 个 处 理 
器 用 到 ， 因 此 也 需要 允许 并 发 读 操 作 。 这 样 ， 为 了 实现 该 算法 ， 需 要 用 CRCW PRAM 模 型 。 


10.2 矩阵 的 行列 式 


考虑 和 矩阵 
A dz ds a 
GQ dy» 023 a 
A=|: 
dn CQ dn3 a 
下 面 是 矩阵 的 初等 行 变换 : 


变换 1: 矩阵 一 行 的 所 有 元 素 都 乘 以 一 个 常数 。 如 果 第 尝 乘 以 常数 CE， 我 们 写 做 R= AR,。 

变换 2: 矩阵 一 行 的 所 有 元 素 都 乘 以 一 个 常数 ， 并 用 另外 一 行 减 它 。 即 R 被 R-kR 赫 代 。 
我 们 写 做 RR,~kR,。 

变换 3: 两 行 互 换 。 如 果 R. 和 RR 互 换 ， 我 们 写 做 RR 一 Rj。 

完成 变换 1 之 后 ， 扼 阵 行列 式 的 值 相当 于 乘 以 后 变换 2 对 和 气 阵 行列 式 的 值 疫 有 影响 ; 变换 
3 改变 矩阵 行列 式 值 的 符号 。 





考虑 第 一 列 对 角 线 下 面 的 所 有 元 素 为 零 的 矩阵 : 


[ed 
心 
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a dy ad a 
0 qd, a» Ca 
Ga 435 Gn 
141= 
0 aa an Cn 
G2 463 da Gn 
G3 G3 0 1 an 
= Ql 


主 元 消去 法 对 和 矩阵 
0 ds dy … 0n 


G3 Gd ds 1 Can 
141l= 


Cn dn2 G3 机 Cn 
进行 行 变换 


C2 
Rh, < Rh, 一 R 
Gil 


如 果 对 和 矩阵 A 进行 上 面 的 变换 ， 那 么 a 会 变 成 零 。 同 样 ， 如 果 进 行 如 下 变换 : 
RoR- 人 Ri-2,3,.n 
A 
那么 第 一 列 对 角 线 下 面 的 所 有 元 素 都 变 为 零 。 这 些 变换 对 算 阵 A 行列 式 的 值 没 有 影响 。 经 
过 上 面 的 变换 ， 会 变 成 gay-(aw/an)ay。 如 仍 用 a; 表 示 ， 变换 后 的 矩阵 如 下 : 
AQ Co ds … Qn 


0 aa ds … da, 


14l= 
0 a am Gnn 
0 Hs 024 C2 
Ga 03 dx a 
= 


Ca Un3 Un4 “Qn 


我 们 对 化 简 的 矩阵 重复 上 面 的 过 程 ， 得 到 和 拓 阵 的 行列 式 : 
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| Al= aa 


Gn3 Gn4 °° Qnm 


A 是 一 个 n x n 的 矩阵 ， 通 过 第 一 步 ， 我 们 把 它 化 简 成 一 个 (n-1) x (xn-1) 的 矩阵 。 现 在 更 进 
一 步 化 简 成 (n-2) x (n-2) 的 矩阵 。 

重复 上 述 过 程 ， 可 以 把 矩阵 化 简 成 一 个 1 x 1 的 和 矩阵。 所以， 最 后 行列 式 的 值 为 l= a oo… 
Gino 

算法 设计 设 4 为 一 给 定 矩 阵 ， 

1. 对 i = 2,3,4,… 交 ， 进 行 行 变换 : 


a; 
及 < R -一 只 
i 


使 得 第 一 列 对 角 线 下 面 的 元 素 都 变 成 零 。 
2. 对 i = 3,4,…n， 进行 行 变换 : 


a; 
R<—R.- ——R, 
G22 282 


使 得 第 二 列 对 角 线 下 面 的 元 素 都 变 成 零 。 
3, 对 i = 4,…,n， 进 行 行 变换 ; 


a, 
R<—R- —R, 
U3 


使 得 第 三 列 对 角 线 下 面 的 元 素 都 变 成 零 。 
一 般 为 了 把 第 k 列 对 角 线 下 面 的 元 素 变 成 零 ， 进 行 如 下 行 变换 : 


ReR- eR,icktl, k+2, .7 
Qu 


对 k = 1.2,3,…m-1， 进 行 上 述 变换 ， 使 得 矩阵 对 角 线 下 面 的 所 有 元 素 都 变 成 零 。 基 后 得 
到 矩阵 的 行列 式 : 
141 = aeQ 

下 面 的 程序 段 就 可 以 完成 所 需要 的 行 变换 : 
ratio = Cauw 
Forj=1ton 
a; = ay—ratio*ay 
nextj 
为 了 让 第 k 列 对 角 线 下 面 的 元 素 变 成 零 ， 就 要 对 i = kt+1,… 重复 上 述 变 换 。 完 整 的 算法 如 下 : 
算法 Sequential Pivotal Condensation 
输入 : 给 定 和 矩阵 A(l:n, 1:n) 
输出 : 行列 式 的 值 

l.Fork=1ton-l 

2. Fori=kt+l ton 





3. ratio = QUau 
4. Do the row operation R, 一 ration * R. 
S.nexti 
6.nextk 
7. Determinant a*ayp* +*a,, 
8. END 
在 上 面 的 串 行 算法 中 ， 第 2 ~ 5 步 的 for 循 环 使 得 第 k 列 对 角 线 下 面 的 元 素 变 成 零 。 在 此 循环 
[zs3| 中 ,任意 两 个 选 代 之 间 是 互相 独立 的 ， 因 而 可 以 由 不 同 的 处 理 器 并 行 执行 。 所 有 的 处 理 器 都 
要 用 到 第 k 行 的 元 素 ， 所 以 实现 此 算法 需要 用 到 支持 并 发 读 的 PRAM 模 型 。 第 4 步 的 行 变换 可 
以 由 下 面 的 for 循 环 完成 : 
4.1 For j=1ton 
4.2 di = ay-ratio*ay 
4.3 nextj 
也 可 以 由 n 个 不 同 的 处 理 器 并 行 完 成 : 
4.1 For j= 1 to n do in Parallel 
4.2 di = a-ratio * a 
4.3 End Parallel 
第 7 步 需要 O(n) 个 处 理 器 ， 且 在 O(log n) 时 间 内 并 行 完 成 。 完 整 的 并 行 算法 如 下 : 
算法 Determinant 
输入 : A(l:n, 1:n) 
输出 : det(4) 
BEGIN 
.Fork=1ton-l 
. For i = k+l] to n do in parallel 
.ratio = QVGA 
.Forj= 1 ton do in Parallel 


. End Parallel 
. End Parallel 
. Next 
.det = a * dy, 六 Cn 
END 
第 1 ~ 8 步 的 循环 执行 次 数 为 -1。 因 此 计算 时 间 为 0(n)。 在 第 2 ~ 7 步 和 第 4 ~ 6 步 有 两 个 并 
行 扯 套 循环 ， 因 此 需要 O(n”) 个 处 理 器 。 第 9 步 与 求 和 算法 相似 ， 需要 0O(m) 个 处 理 器 ， 且 在 
O(log 站 时 间 内 完成 。 所 以 上 述 并 行 算法 需要 OU 个 处 理 器 ， 在 C(m 时 间 内 完成 。 


10.3 线性 方程 组 
线性 方程 组 一 般 表示 形式 为 : 


1 
2 
3 
4 
.ai = 0 一 Tatio * Qu 
6 
7 
8 
9 
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CIIXI 十 Gi2AX2 十 十 GInXn = Gln 


CIXI 十 dyX2 tt onXn 一 Cantl 


Cr +t dn2X2 十 十 GoXn = nn 


线性 方程 组 的 解 是 指 满足 上 面 方程 的 一 组 值 x,x,… x,。 


如 果 用 下 面 的 矩阵 表示 : 
0 ds 05 a 
ta Gy 023 02 
da G3 033 Gs 
Qn dn dn3 Gm 


叫做 右 端 向 量 (right-hand-side vector)。 在 一 些 特殊 情况 下 ， 可 以 直接 求 得 方程 组 的 解 。 


例 1 
如 果 一 个 方 阵 除了 对 角 线 元 素 非 零 之 外 ， 共 他 非 对 角 线 元 素 都 为 零 ， 则 叫做 对 角 矩 阵 


(diagonal matrix )。 假 定 系数 秆 阵 是 对 角 和 矩阵 。 即 系数 矩阵 的 形式 如 下 : 


a 0 0 … 0 
0 a 0 0 
ay 0 

0 0 0 Gn 


那么 对 应 的 方程 组 满足 下 面 形式 : 
QiX) = Gian 
dn X2 = zntl 





上 > 
人 
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这 个 方程 组 的 解 可 以 直接 写成 : 


in Ca ns CQ 
9 








XI 三 ?9 3 
Gil 022 Grn 


例 2 
如 果 一 个 矩阵 对 角 线 之 上 的 所 有 元 素 都 是 零 ， 则 称 作 下 三 角 矩 阵 (lower triangular)。 


设 系数 矩阵 为 下 三 角 矩 阵 ， 即 有 如 下 形式 : 


al 0 0 … 0 
dx Uy 0 0 
[2 33 0 
Un dn dn3 Unn 
相应 的 方程 组 为 : 
GUXI = Glintl 


QiXi 十 A22X2 = G2 


QnXi 十 dX 十 … 十 Carkn = nntl 


从 第 一 个 方程 可 求 得 x， 三 Ginruyau。 求 出 x 后 ， 将 其 代入 第 二 个 方程 ， 我 们 可 以 求 出 x;: 


1 
X2 =— (42n — QuXi) 
G22 


求 出 后 ， 我 们 可 以 用 下 面 的 等 式 求 出 x;: 


1 
X= -一 (Go — aX — ayX2) 
033 


类 位 地 ， 我 们 可 以 求 出 Xx;,… ,x,。 上 面 的 方法 称 作 向 前 消去 法 (forward substitution 


method )。 


例 3 
假定 系数 矩阵 是 一 个 上 三 角 和 矩阵 。 那 么 方程 组 有 下 面 的 形式 : 


QuXi 十 QaX2 十 十 dun = in 


G2X2 十 … 十 dorXn = G2 


neXn 三 nntl 


我 们 可 以 从 最 后 一 个 方程 开始 。 由 最 后 一 个 方程 ， 我 们 可 以 求 出 x 的 值 : 





四 
an 一 
Gm 


接着 利用 第 (2- 1 个 方程 求 出 zx 
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an 一 (Cn ~ ainX,) 


ntl 


一 般 在 求 出 ,1,…, x 之后， 我 们 再 求 。 
这 样 ， 我 们 可 以 求 出 所 有 的 x;。 此 方法 称 作 向 后 消去 法 (backward substitution )。 


10.3.1 高 斯 消 元 法 


考虑 方程 组 : 
OA + dXs tt dX = ds 
AX 十 Q22X2 十 … 十 dy = Qn 
Cn 十 Un2X2 十 … 十 Carkn 三 Cai 
可 以 用 下 面 的 矩阵 形式 表示 : 
dy Mz 0 i an XI in 
dy Cr Ud» Gn | [Xa G2n+1 
Ua G3 033 Gn | | Xs Gauntl 
Us 0 dn 1 dm | |X, Annsl 
对 上 面 的 矩阵 进行 主 元 消去 法 的 行 变换 ， 可 以 化 简 成 下 面 的 形式 : 
Uy dz G3 Cn 
0 Gao dns a 
0 0 a 03 
0 0 0 nn 
这 样 ， 我 们 就 可 以 用 向 后 消去 法 进行 求解 。 此 算法 主要 由 以 下 三 步 组 成 : 
]. 读 矩 阵 A; 


2. 将 矩阵 化 成 上 三 角形 式 ; 

3. 用 向 后 消去 法 进行 求解 。 

我 们 已 经 在 主 元 消去 法 中 对 入 阵 化 简 成 上 三 角形 式 进行 了 讨论 。 该 操作 用 到 CREW PRAM 
模型 ， 需 要 Om?) 个 处 理 器 ， 且 在 O(n) 时 间 内 完成 。 在 向 后 消去 法 中 ，x 只 能 在 求 出 XX Xi 
之 后 进行 求解 。 

求解 x 的 运算 是 内 在 串 行 的 。 每 一 个 x 需要 O(n) 个 处 理 器 ， 且 在 O(log nn) 时 间 内 完成 。 因 
此 高 斯 消 元 法 可 以 在 CREW PRAM 模 型 中 用 O(n”) 个 处 理 器 并 在 O(n) 时 间 内 实现 。 

部 分 选 主 元 ”在 高 斯 消 元 法 中 ， 对 第 k 行 所 进行 的 行 变换 是 先 用 主 元 a 和 除 ， 再 用 ais 乘 。 如 
果 ai 是 零 或 者 在 量 级 上 相对 比较 小 ， 那 么 此 过 程 将 会 导致 诸如 截断 误差 或 合 入 误差 等 方面 的 


Le 
oo 
心 
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计算 错误 。 为 了 避免 这 一 点 ， 我 们 可 以 对 第 k 列 的 对 角 元 素 和 对 角 线 下 面 的 元 素 进 行 选择 。 如 
果 ai 是 最 大 的 元 素 ， 我 们 可 以 交换 第 k 行 和 第 1 行 ， 然 后 继续 进行 消 元 过 程 。 此 方法 叫做 部 分 
选 主 元 法 (partial pivoting)。 在 前 面 算法 DETERMINANT 解 释 过 的 消 元 过 程 中 ， 在 第 1 步 和 第 
2 步 之 间 我 们 要 查找 第 k 列 对 角 线 下 和 对 角 线 的 元 素 ， 以 便 找 到 最 大 的 元 素 ai。 然 后 我 们 要 把 
第 Kk 列 和 第 1 列 互 换 。 在 O(n) 个 处 理 器 上 ， 选 择 最 大 元 素 的 运算 可 以 在 log(n-k+1) 时 间 内 完成 。 
所 以 ， 如 果 在 高 斯 消 元 法 中 加 入 部 分 选 主 元 ， 在 CREW PRAM 模 型 中 需要 用 O(n”) 个 处 理 器 ， 
且 在 O(n log 时 间 内 完成 。 
Sameh 和 Kuck 以 经 典 的 Givens 次 转 矩 阵 分 解法 为 基础 给 出 了 一 个 并 行 算法 。 


10.3.2 ”Givens 旋转 


考虑 一 个 常见 的 a 阶 稠密 方 阵 。 设 三 个 整数 ij,k < mn。 假定 在 第 ; 行 和 第 j 行 中 前 面 的 (x 了 D) 列 
元 素 都 是 零 ， 而 第 K 列 元 素 都 非 零 。 即 有 下 面 的 形式 : 


末 六 水 站 
0 0 0 OQ * 来 炒 
0 0 0 DO * 六 来 
es * 。。 ..、 .. 
ko 

1 

第 k 列 


上 面 矩阵 形式 中 的 * 表 示 非 零 元 素 。Givens 旋 转 法 就 是 使 得 下 标 为 Vi, 和 的 元 素 为 零 的 方法 。 
利用 Givens 旋 转 法 ， 我 们 可 以 把 矩阵 对 角 线 之 下 的 元 素 变 为 零 。 下 面 我 们 来 看 一 下 Givens 旋 
转 法 的 具体 过 程 。 考 虑 下 面 的 矩阵 : 


1 0 0 .0 
0 1 0 2 0 
0 0 0 c 5 > 0 
0 0 0 一 C 0 
0 0 0 1 


1 1 
第 列 第 / 列 
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其 中 cs- 于 
Nata arta 

下 面 给 出 矩阵 乘积 G4 的 一 些 有 趣 的 性 质 。 
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1. G 是 一 个 正 交 矩阵 ; 

2. 对 p = i 和 op =j， 有 GA(p,g) = ap; 

3. 对 gq <k， 有 GA(i,q) = GAQ,q) =0; 

4.GAG, A =0。 

证 明 : 从 欧 几 里 德 范 数 可 以 验证 G 是 正 交 和 矩阵 。 如 果 P = i 且 p =j， 那 么 G 的 第 p 行 和 单位 矩 
阵 第 p 行 相同 。 当 此 行 用 在 矩阵 乘积 C4 时 ， 并 不 影响 4 的 值 。 因 为 当 g& Kk 时 , a = 0 且 4 = 0。 


。 乍 阵 G 称 作 Givens 旋 转 矩 阵 (Givens rotation matrix ) 。 





GA(J,hk) = 之 EE 


= S810 
= Sax 十 CQ 
=0 
选择 矩阵 4 的 两 行 ， 我 们 可 以 应 用 Givens 旋 转 ， 使 得 矩阵 下 标 为 0,D 的 元 素 的 值 为 零 。 特 
别 要 注意 的 是 Givens 旋 转 只 影响 所 涉及 的 行 。 选 择 不 同 的 矩阵 行 对 ， 我 们 可 以 并 行 应 用 
Givens 旋 转 ， 并 使 得 对 角 线 下 面 的 元 素 为 零 。 如 果 想 把 第 k 行 对 角 线 下 面 的 所 有 元 素 都 变 成 零 ， 
我 们 可 以 将 第 (K+1), (k+2),…,n 行 和 第 1,2,… 火 行 成 对 组 合 ， 然 后 并 行 应 用 Givens 旋 转 。 
BEGIN 
For j = k+l] to n do in Parallel 
(iis a number from 1 to k and distinct for each j.) 
Apply Given’s rotation for ith and jth row 
End parallel 
END 
上 面 的 算法 段 使 得 对 角 线 下 面 的 矩阵 元 素 变 成 零 。 我 们 来 分 析 Givens 旋 转 的 复杂 度 。 设 
有 两 个 矩阵 : 
A=(ay)  CG=( 
和 矩阵 乘积 GA 中 只 有 和 矩阵 4 的 第 ; 行 和 第 j 行 改变 ， 而 其 他 的 元 素 没 有 变化 。 我 们 要 求 GA 并 
把 结果 存在 相同 的 变量 中 。Givens 旋 转 只 影响 矩阵 4 的 下 列 元 素 : 
Ci Ga 291 
Ox Qj“ Ujin 
因此 不 需要 求解 矩阵 乘积 C4， 只 需求 G4 的 这 些 元 素 就 足够 了 。 由 于 G4 的 第 : 行 是 : 
(G4)， = > 8aan ， 其 中 L2K 


同样 ， 
(GA); = > 8nan ， 其 中 t>k 
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因此 ， 对 每 一 个 :2k，(GA4);, 和 (GA); 可 以 在 0(1) 时 间 内 求 出。 

下 面 的 程序 段 也 应 用 了 Givens 旋 转 : 

1. For t= kton do in Parallel 

2.a,~ gi Aut By a 

3.Q 0 Bi lu + 8 a 

4. End Parallel 

如 果 用 O(n) 个 处 理 器 ， 一 对 行 的 Givens 旋 转 可 以 在 0(1) 时 间 内 完成 。 一 和 盾 阵 行 所 有 对 角 线 
之 下 的 元 素 可 以 同时 用 [n/2] 对 佐 阵 行 的 Givens 旋 转变 换 成 零 。 所 以 ， 用 OC) 个 处 理 器 把 一 算 
阵 行 所 有 对 角 线 以 下 的 元 素 变 成 零 的 时 间 为 0(1)。 用 O(n”) 个 处 理 器 把 一 个 矩阵 化 简 成 下 对 角 
和 矩阵 的 时 间 为 O(n)。 


10.4 傅 里 时 变换 
负数 的 平方 根 在 实数 域 中 没有 定义 。 数 学 家 们 定义 了 虚数 i= V-1 ， 并 且 发 展 了 称 为 复 分 
析 的 理论 。 令 人 惊讶 的 是 这 一 理论 在 实际 中 有 大 量 应 用 ， 如 数字 图 像 处 理 等 。 


12 有 两 个 根 +1 和 -1。 同 样 地 ，12 有 三 个 复 根 。 推 广 到 1"， 它 有 ?个 根 ， 将 其 分 别 记 为 
,7,08,…,tw0"1, 1， 它 们 称 为 a 次 单位 根 ， 其 中 必 称 为 单位 原 根 。 可 以 很 容易 求 出 : 


， 2kr ，，2jkr 
0 =C0S—~+15sIN 一 一 
天 n 


当 n = 3 时 ， 相 应 的 三 个 单位 根 为 : 
2.1.T . .2:1:nx 
+isin 
3 


= CcOS120° +isin120° 





= COS 











4T .. 4n 
= COS 一 -+isin 一 一 
3 3 


= COS240° +isin240? 
-21183 
2 2 


Ww’ = COS2NA +i sin2n 
=1 


因此 3 次 单位 根 为 : 
-1 .V3 
Oo= 一 +i 一 一 
2 2 
) -1] .V3 
0 = 一 -ji 一 
2 2 
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类 似 地 ，1”“ 的 四 个 单位 根 分 别 为 : 


nx .. 2nx nx .，., NX . 
W=Cc0s—— +isin~— =cos—+isin—=i 
4 
:=cosr+isinr = 一 1 
3 3r ,， .3r . 
0 = cos 一 +isin 一 =-i 
2 2 
“= cos2r+isin2=1 


因此 ，i,-1,-i 和 1 是 4 次 单位 根 。 令 W 为 n x 1 年 阵 ， 行 和 列 的 标记 分 别 从 0 到 -1， 且 
W(iy) = 内 ， 这 里 ow 表 示 n 次 单位 原 根 。 


即 有 : 
W(0,0)= of=1 
W(0,1])= f=1 
W(0,2)= =1 
更 一 般 地 ， 
W(O0N = 1,j=0,1,2,…,n-1 
W(i,0) = 1,i= 0,1,2,…n-1 
W(1,1)= 
WW(1,2) = oz 
W(1,3)= 
矩阵 W 表 示 如 下 : 
1 1 1 1 1 1 
1 人 CD? (oO3 0 se WO" 
1 oo? ww ws 0 和， WD 
oa 
由 于 or = 1，W 可 用 ww, ,0 …,00"1, 1 来 表示 : 
1 1 1 1 1 
1 ow wo wi 四 全 
1 oo 0 ww 


假定 
X= [Xo Xp 


为 m 维 向 量 。 向 量 X 的 离散 傅 里 叶 变换 为 向 量 7 = WX。 
例 


取 = 3, 我 们 已 经 计算 出 w = -1/2+(V3/12)i w? = -1/2-(V3712) 和 oz = 1， 抵 阵风 为 


MD 
© 
小 
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假设 


向 量 X 的 傅 里 叶 变换 为 : 


即 : 


如 果 


则 X 的 傅 里 叶 变换 为 : 


其 中 


1 1 1 
W=|Il w ww 
1 w ww 
Xo 
X=|x 
X2 


% = Xo + Xi+X, 
Y = xo + Xi + 0X, 


FE = Xo + Xx + x 


X=|-l 
0 
六 
了 = | 也 
Y 


=xo+xn+Xx2=1-1+0=0 
Y = xo + Wx + 0 Xs 


=]-@w 
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因此 向 量 X 的 传 里 叶 变 换 为 : 


现在 我 们 设计 一 个 并 行 算法 来 求 给 定向 量 X 的 传 里 叶 变 换 。 给 定 x4， 可 以 利用 下 面 公式 计 
算 必 的 值 。 


2kr .. 
00* J cos +isin a k=0,1,2,,n—1 
n n 


利用 n 个 处 理 器 并 行 计算 er， 而 矩阵 W 的 元 素 用 w 个 处 理 器 并 行 处 理 ， 即 : 
WO = ww, 0&iy<n-l 

因此 ， 如 果 用 闫 个 处 理 器 ， 则 矩阵 允 就 可 以 在 O(1) 时 间 内 构造 出 来 。 傅 里 叶 变换 是 ” x 入 
阵 W 与 向 量 X 的 乘积 。 如 果 用 通常 的 矩阵 乘法 ， 上 述 运 算 需 要 O(n”) 个 处 理 器 ， 执 行 时 间 为 
O(log n)。 并 行 算法 如 下 : 

算法 Fourier 

输入 : X(0:n-1) 

输出 : Y(0:n-1) 
For k=0 ton-l in parallel 
0 = COs 27k/n + i sin 2nk/n 
End parallel 
For i= 0 ton-l do in parallel 
For j=0 ton-!1 do in parallel 
WCG) = 0 
End parallel 
End parallel 


oo Dr 


For i= 0 ton-l do in parallel 
10. Yi= Yo WD*%, 
11. End parallel 
上 述 算 法 中 第 10 步 是 求 和 算法 ,需要 O(n) 个 处 理 器 ， 执 行 时 间 为 0(og n)。 因此 上 述 算法 
需要 O(n) 个 处 理 器 ， 总 的 执行 时 间 为 O(log nn)。 
储 里 叶 变 换 有 效 并 行 算法 ”本 节 我 们 设计 分 治 (divide-and-conquer) 并 行 算法 ， 该 算法 
在 同一 时 间 内 可 以 用 较 少 的 处 理 器 来 求 传 里 叶 变 换 。 即 算法 所 用 时 间 为 O(log n)， 处 理 器 数 为 
O(n log n)。 
在 离散 傅 里 叶 变换 的 有 效 并 行 算 法 设计 中 ， 和 矩阵 W 的 结构 和 er = 1 的 性 质 起 到 了 很 关键 的 
作用 。 下 面 列 出 对 不 同 的 x， 和 矩阵 W 的 值 。 当 n = 4 时 ， 
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1 1 1 1 
1 om 0 ww 
lw 1 w 
low w 
当 n = 8 时 ， 
11 1 1 1 1 1 1 
loo wo oo wo w 
lo ow 1 ww oo 
lo wo wo ow ww’ 
Wi 和 
lo wo oo wo wo wi 
lo wo 1 ow wo 
lo oo wo ow w 
在 偶数 行 利用 os = -1 的 性 质 ， 有 
1 1 1 1 1 1 1 1 
1 wo ow ww -1 -0 -0 -ow 
1 wo ww 1 wo ww ws 
1 oo -wo om -1 -ow ww -ow 
1 -1 1 -1l 1 -ll 1 -l 
1 -mo ww -0 -1 ww -wo oo 
lo os ww 1 oo ww ww 
1 


注意 : 

1. 当 ; 为 偶数 且 0 <i< nl 时，W(iy) = W(i,2)) (0 <j < n/2); 
2. 当 ; 为 奇数 且 0 <i<n-1 时 ，W(iy) = 一 W(i,2)) (0 <j<n/2)。 
计算 Y= WX， 便 有 如 下 的 结论 : 

1. 当 i 为 偶数 且 0 < i< n-1 时 ， 


n/t2-1 


yi= DLR + Xjrn2) 


2. 当 i 为 奇数 且 0 < i< n-1 时 ， 


y= WD — Xjunn) 


已 知 w? 是 n/2 次 单位 原 根 ， 即 mn/2 次 单位 根 为 1 ,7,0w'…,w"*。 又 假定 i 是 偶数 且 满 足 0 < i< 
n~1， 令 i = 21, 0¢<1&n/2。 


ni12-1 


y= DP WD YC +xX;+n/2) 
/ 


ni2-l 
= Da *(x, 十 X +n/2) 
£ 
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yz = (@ 7) *(x; + XxX),+n/2) 
yz2r = Foy *(xi + xX; +n/2) 
可 以 看 出 


是 如 下 向 量 的 传 里 叶 变 换 : 


Xo + Xs2 


Xi + Xzrl 


Xj + Xjrnr2 


Xnr2-1 + Xa! 


类 似 地 ， 当 i 是 奇数 且 满 足 0<i<n-1 时 , 令 i = 21+1，0<1<n/2， 可 以 推导 出 : 


nf2-1 
yi = Xo) *¥ 0 (Xx) + Xjrn2) 
2 


这 表明 
Y 
六 
站 
i 
是 如 下 向 量 的 侍 里 叶 变 换 : 
Xo + Xns2 
(Xi — X21) 
W(x — X242) 
OW (X21) + Xa 
计算 完 下 面 两 个 侍 里 时 变换 
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和 
7 
蕊 
r 
了 
Xo 
我 们 可 以 计算 向 量 | ” | 的 健 里 叶 变 换 
Xn 
yo 
多 
Vn- 
当 = 2 时 ， 向 量 
Xo 
四 
的 健 里 叶 变 换 可 以 直接 计算 。 


Yo Xo txXl 
| 
下 面 给 出 计算 n 维 向 量 传 里 叶 变 换 的 有 效 分 治 并 行 算法 。 
算法 Efficient-FOURIER 


输入 : x(0:1) 
输出 : Y(0:n-1) 
1.Ifn=2 then 


Xot+X 
国 = | " | and exit 


BA Xo— Xl 


2. Recursively evaluate the Fourier transform of the vector 


Xo + Xn/2 
Xi 十 ny231 了 
到 
301 …- and store as | ¥, 
Xi + Xjyni2 也 
an12-1 + Xan-1 


3. Recursively evaluate the Fourier transform of the vector 
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Xo 十 X12 


W(X ~ Xn Xn ) y 


x 


and store as | ¥ 


W(X 一 oran) 


了 
Xj + Xjrni2 


Co + Xn-1) 


4. Output the vector Y(0:n—1) 
复杂 度 分 析 上 面 算法 的 第 2 步 与 第 3 步 是 彼此 独立 的 ， 可 以 并 行 执行 。 整 个 过 程 是 将 一 
个 n 维 向 量 分 为 两 个 n/2 维 向 量 ， 且 以 递归 方式 执行 。 因 此 整个 过 程 要 用 O(n log nn) 个 处 理 器 ， 
执行 时 间 为 O(log n)。EREW PRAM 模 型 可 以 实现 此 算法 。 
现在 ,我 们 来 看 一 个 有 趣 且 常用 的 伟 里 叶 变 换 的 应 用 。 


10.5 多 项 式 乘法 
考虑 n 次 多 项 式 a(x) 


a(x) = ao + AX + QsX? ++ QsX" 
假定 a,#= 0 (否则 为 -1 次 多 项 式 )。 
本 节 主 要 讨论 次 数 分 别 为 xz 和 m 的 两 个 多 项 式 的 乘积 。 
CON) = ao + ax + dzx: +'*+ a 
b(x) = bo + bix+ box 十 十 Po 302 


乘积 a(x)b(X) 是 (m+n) 次 多 项 式 ， 设 a(x)b(x) = c(X) = co +tcwx + Cx? 十 十 Corp 。 
这 里 

Co = Gopo 

C1= aop + aibo 

cz = aob; + GBP + a;bo 


cs = aob; + aib; + ap + asbo 


大 


Cr 一 六 cb 
es 


这 里 0<k< m+n， 并 且 假 定 当 i > n 时 ，a; = 0; 当 ) > mm 时， 已 = 0。 如 果 由 关于 cx 的 公式 来 
直接 求解 问题 ， 每 一 个 ci 可 以 用 m+n 个 处 理 器 组 并 行 计算 ， 每 一 组 同时 需要 k 个 处 理 器 ， 执 行 
时 间 为 O(log k)。 由 于 k 的 最 大 值 为 m+n， 上 述 方 法 共 需 要 O((m+n)”) 个 处 理 器 、， 执 行 时 间 为 
O(log(m+n))。 

算法 ST-POLY-MUL 

输入 : 4(0:m and B(0:m) 
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输出 : C(0:m+nm) 
BEGIN 
1. Assign A(n+l:n+tm)=0 
2. Assign Bl(m+l:ntm)= 0 
3. For k=0 to m+n do in parallel 
4. Evaluate cx = > ‘ab 
5. End parallel 


传 里 叶 变 换 可 以 有 效 地 计算 两 个 多 项 式 的 乘积 ， 仪 需要 处 理 器 数 为 O((m+tn)log(m+n))， 执 
行 时 间 为 O(log(m+n))。 读 者 很 容易 证 明 用 EREW PRAM 模 型 可 以 成 功 地 实现 该 算法 。 
多 项 式 乘法 有 效 算法 前 面 我 们 已 经 讨论 了 由 k 个 元 素 组 成 的 向 量 的 有 效 伟 里 叶 变 换算 法 。 
303] a(X) 和 bb(x) 分 别 是 n 次 和 m 次 多 项 式 ， 分 别 用 数组 a[0:n] 和 b[0:m] 来 表示 。 设 NN 是 一 个 2 的 竹 次 方 
的 整数 ， 且 n+tm < N< 2(ntm)。 假 定 afn+1:N-1] = b[m+1:N-1] = 0。 下 面 我 们 计算 向 量 a 和 45 的 
全 里 叶 变 换 Y = Wa 和 2Z = Wb。 . 
通过 观察 可 得 到 下 面 结果 : 
1.y,=a(w),0<icN-l; 
2.z=pbo),0<sisN-1l。 
记 w = (Uo Us)"， 这 里 w= yiz;。 如 果 u = Wc， 其 中 c = [coco…co， 则 Ko) = 
a(w)b(w)。 可 以 证 明 如 果 c 被 确定 ， 则 c 是 多 项 式 a 与 5 的 乘积 ， 且 向 量 c 的 前 m+n 个 元 素 可 以 看 
作 乘积 多 项 式 c(x) 的 系数 。 
算法 EFFICIENT-POLY-MUL 
输入 : a[0:n], b{0:m] 
输出 : c[0:m+n] 
. Let N be the integer which is power of 2 Such that (m+n) < NS 2(mt+n) 
Assign aln+l:N] = blm+l:N] =0 
Compute the Fourier transform of a, Y = Wa using the efficient algorithm 
Compute the Fourier transform of b, Z = Wb using the efficient algorithm 
For i = 1 to N do in parallel 


Ha 


U; = Ci 
End parallel 
,Evaluate the inverse Fourier transform of u. i.e determine the vector c such that x = Wc 


Do ~ 个 (LA iD 


.Cc[O:m+n] is the coefficient vector of the product polynomial c(x) 
END 
计算 传 里 叶 变 换 的 有 效 并 行 算法 共 需 处 理 器 数 为 O(N log N)， 执 行 时 间 为 O(log N)。 同 样 ， 
304] 计算 传 里 叶 逆 变换 也 需 OCN log 和 个 处 理 器 ， 执 行 时 间 也 为 O(log N)。 由 于 N 的 选取 ， 我 们 有 
如 下 结论 : 
如 果 a(z) 和 2(z) 分 别 是 m 次 和 普 次 多 项 式 ， 它 们 的 乘积 多 项 式 c(x) = a(x)b(x) 可 用 
O((m+n)log(m+n)) 个 处 理 器 并 行 处 理 ， 所 用 时 间 为 O(log (m+n))。 
读者 可 以 证 明 EREW PRAM 模型 可 有 效 地 实现 这 个 算法 。 
设 a[0:n], b[0:n] 是 两 个 向 量 。a 与 5 的 卷 积 记 为 axb， 并 定义 为 向 量 c[0:m+n]， 这 里 
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c[0:m+n] 是 a 与 bp 所 表示 的 多 项 式 的 乘积 ， 且 c(m+n+1) = 0。 卷 积 有 着 广泛 的 应 用 。 两 个 多 项 式 
卷 积 计算 的 复杂 度 与 多 项 式 乘法 的 复杂 度 相同 。 
10.6 和 拖 阵 求 逆 
高 斯 - 约 当 (Gauss-Jordan) 消 元 法 可 以 用 来 计算 矩阵 的 逆 。 
Ur diz Qs On 


Co dn 023 °°* 


03 dy 033 ”Can 


A= 
Gt Cn2 3 a Gn 
考虑 矩阵 
1 00… 0 
0 1 0.…… 0 
1 001…0 
A A= 
0 0 0 1 
将 4 代入 ， 得 : 
Qu aa Ga Gun 100.…… 0 
Qa 02 G3 … G2n 0 10-...0 
2 Gy Ga 03 Gan _ 001-...0 
i Anz Gn3 *** Gm 000...1 


下 面 用 高 斯 - 约 当 靶 使 等 式 左边 的 矩阵 A 变 成 单位 阵 ， 同 样 的 行 变换 用 于 等 式 右 端 算 阵 ， 
得 到 


100…0 
0 10…0 
0 0 1…0 
辽 _ 305 
000...1 


即 等 式 右 端 矩阵 为 4-:。 该 算法 包括 以 下 几 步 : 

1. 读 入 和 矩阵 4; 

2. 右 端 矩阵 记 为 及 ， 开 始 时 令 B 为 单位 阵 ; 

3. 对 A 作 行 变换 并 且 对 B 作 同样 的 行 变换 ， 最 后 将 4 化 为 单位 阵 。 
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将 4 通过 行 变换 化 为 单位 阵 的 算法 类 似 于 高 斯 消 元 靶 。 相 应 的 并 行 算法 如 下 : 
算法 MATRIX-INVERSE 

输入 : 算 阵 4(1:2， 1:n) 

输出 : 和 矩阵 4-'(1:n, 1:n) 


BEGIN 
1. Assign 4 = identity matrix 
2.Fork=l1ton 


3. Fori= 1 ton butizxkdoin parallel 
4. do row operation for the matrices A and 4- 
R,— R—(ay/an)R, 
5. End parallel 
6. Nextk 
END 


在 上 述 算法 中 ,第 1 步 可 以 用 O(n”) 个 处 理 器 来 执行 ， 所 用 的 时 间 为 0(1)。 第 4 步 的 行 变换 
需 用 O(n) 个 处 理 器 ， 执 行 时 间 为 0(1)， 因 此 第 3 ~ 5 步 在 单位 时 间 内 需 用 O(n”) 个 处 理 器 来 执行 。 
总 的 复杂 度 为 用 O(n") 个 处 理 器 ， 执 行 时 间 为 O(n)。 可 以 用 CREW PRAM 模型 实现 。 


三 角形 和 矩阵 的 逆 
考虑 如 下 7m 阶 下 三 角 方 阵 ， 为 方便 起 见 ， 这 里 "是 2 的 寡 次 。 
al 0 0 … 0 
aa 0 … 0 
306 da aa ad» … 0 


nt Gnz Gn3 °° Gm 
将 矩阵 分 成 四 个 子 矩 阵 ， 每 一 个 子 拒 阵 的 阶 为 Ca/2) x (n/2)。 


A 0 
“la 


由 于 4 是 非 奇异 的 ， 因 而 4, 4: 也 是 非 奇 异 的 。 我 们 首先 计算 47 和 As'。 


4 0 Ar' 0 1 0 -1 
[a 4 -AhA A 10 7” 


| 和 0 
-A 


因此 有 


综 上 所 述 ， 求 矩阵 4 的 逆 可 分 成 以 下 几 步 : 
1. 计算 4 和 45 的 值 ; 
2. 计算 A,47'; 
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3. 计算 -45 4247。 

为 了 计算 4 和 A4;' 的 值 ， 我 们 采用 递归 方式 。 在 每 一 次 递归 调用 时 ， 秆 阵 的 阶 被 一 分 为 二 ， 
因而 总 的 递归 步 是 log n。 在 每 一 步 中 我 们 要 计算 两 个 较 小 矩阵 的 逆 ， 也 要 计算 如 第 >，3 步 所 
示 的 两 个 较 小 矩阵 的 乘积 。 最 著名 的 计算 两 个 ” x "矩阵 乘积 的 并 行 算 法 需要 C(a) 个 处 理 器 ， 
所 用 的 时 间 为 O(log n)， 且 用 CREW PRAM 模 型 来 实现 。 

如 果 用 T(n) 表 示 求 n 阶 矩阵 的 逆 的 并 行 算 法 的 执行 时 间 ， 则 有 

T(n) = 2T(n/2) + 30(]0g n) 
= 2{2T(n/4) + 30(l0g n)} + 3O(og n) 
根据 这 个 递 推 式 ， 可 以 求 得 T(n) = O(log? n)。 因 而 上 述 并 行 算法 需 O(m) 个 处 理 器 ， 执行 时 间 
为 O(log’ n)。 

算法 Triangular-Matrix-Inverse 

输入 : 下 三 角 矩 阵 4(1:m, 1:n) 

输出 : 4-(1:m, 1:n) 


0 
1.Split Aas A= 四 4| 


2. Evaluate recursively 4 and 43 
3. Evaluate A,A7! 
4. Evaluate —As'iA,Ar! 


5. A"= 全 0 
| -A hhAr 有 


6. return 4- 
10.7 Toeplitz 和 矩阵 


现在 考虑 另外 一 类 有 趣 的 矩阵， 它们 经 常 出 现在 崩 号 处 理 的 应 用 中 ， 这 类 和 矩阵 叫做 
7Tpeplitz 矩 阵 。 本 节 我 们 设计 求 三 角形 Toeplitz 矩 阵 的 逆 的 算法 。 考 虑 如 下 矩阵 ; 


Qn Un-2 Qn-3 “°° ad: ao 
Ud dn 0 "Gs a 
Qn Ad 0 ‘'* G3 a 


Ganzy G2n3 Ga °° On Gn 


上 面 这 个 矩阵 仅 有 (2n-2) 个 不 同 的 元 素 ， 甜 阵 满足 如 下 条 件 : 
AG))=Atl, jt) ij=1,2,…,n-l 
所 有 的 对 角 元 素 都 相等 。 我 们 可 以 用 一 个 24-2 阶 的 向 量 来 代替 n x n 的 Toeplitz 矩 阵 ， 此 向 
量 为 


A = [cua， CD 2n-2] 7 
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以 下 为 Toeplitz 什 阵 的 一 个 例子 : 








308 这 是 一 个 5 x 5 的 Toeplitz 指 阵 ， 可 用 向 量 [5,9,8,13,29,1S,1,-1,11] 来 表示 。Toeplitz 和 矩阵 的 特 
殊 结构 能 够 用 来 设计 有 效 的 并 行 算 法 。 考 虑 一 般 的 矩阵 4(0:m-1.0:m-D 和 向 量 x = (ov wo-)。 
用 直接 矩阵 乘法 算法 计算 Ax 如 下 : 

算法 Matrix-Vector-Product 
输入 : A(0:n-1,0:n-1),x(0:n-1) 
输出 : The product Ax denoted by the vector Y(0:n—1) 
1. Fori=0 ton-l do in parallel 
2. y= 六 名 CI 
3. End parallel 
上 面 的 直接 算法 需 0(n”) 个 处 理 器 ， 执 行 时间 为 O(log n)。Toeplitz 人 矩阵 特殊 的 性 质 可 以 减 
少 所 需 处 理 器 的 个 数 。 假 定 4 是 一 个 n x n 的 Toeplitz 和 矩阵 ， 它 也 可 以 表示 为 一 个 向 量 ， 记 矩阵 4 
的 向 量 表 示 为 . 
a = [aoaia ,2 7) 
定理 10-2 ”假定 a = [Qo,a1y42,…s42mz] 是 n 阶 Toeplitz 方 阵 A 的 向 量 表示 ，X = (or 是 一 
向 量 。 如 果 a 和 x 的 卷 积 是 y = ax， 则 有 


y2n-2 
证 明 : 在 Toeplitz 失 阵 A 中 ， 第 k 行 是 4,_1…aw qa:。 由 和 矩阵 乘积 C = Ax， 得 


Cr = Qin-IXoTGhn-2XiI 十 十 Qtn-l 


根据 卷 积 定义 ， 有 
Vin-l = Gn-iXot rm-2X1t +a 
证 毕 。 
309 由 上 面 定 理 知 ，Toeplitz 和 矩阵 与 向 量 的 乘积 等 于 两 个 向 量 的 卷 积 ， 因 而 ， 我 们 有 如 下 
定理 。 


定理 10-3 nxn 阶 Toeplitz 延 阵 与 n 维 向 量 的 来 积 计 算 所 需 的 处 理 器 为 O(n log n)， 执 行 时 间 
为 O(log n)。 





第 10 昔 代数 方 利和 超 降 221 





下 三 角 Toeplitz 和 矩阵 
考虑 王 三 角 Toeplitz 和 矩阵 


Ga ao 0 
Qn- Co Cn-3 Co 
Toeplitz 矩 阵 可 以 用 它 的 第 一 列 [ao,a1,4;… sas] 惟一 表示 。 我 们 利用 分 治 技 术 求 4 的 逆 。 将 
4 分 成 四 块 : 
4 0 
| 4 


上 面 这 样 分 块 是 可 能 的 ， 共 中 A4, 是 下 三 角 Toeplitz 和 矩阵 ，A, 是 Toeplitz 和 矩阵 。 
利用 下 三 角 和 矩阵 的 逆 的 结论 ， 有 


| 0 
-4044 A 





首先 我 们 要 递归 地 计算 4, 的 赣 〈 也 是 一 个 下 三 角 的 Toeplitz 和 矩阵)，4 ,是 Toeplitz 下 三 角 算 
阵 ， 我 们 求 出 47 的 第 一 列 。 求 出 47' 后 ， 再 计算 47'4,47' 的 第 一 列 。 这 个 过 程 表 示 如 下 。 

假定 e = (1,0,0…,0)"。 首 先 计算 47*， 给 出 47 的 第 一 列 ， 然 后 计算 4,(4r'e)， 这 是 Toeplitz 矩 
阵 和 向 量 的 乘积 ， 然 后 计算 47"(4x(4i'e))。 由 结合 性 ， 我 们 有 

Ar'A,Ar'e = Ar'(A(Ari'e)) 

算法 Tria-Toeplitz 

输入 : A[0:n-1] 

输出 : 4-'[0:n 一 1 


4 0 
1. Divide the matrix A into the form 
[4 


2. Evaluate 4i: recursively 
3.Lete= [1,0.0,0… 和 下 
4. Evaluate (Ar'e) 
$. Evaluate A,(Ai'e) 
6. Evaluate Ai'(A,(Arnie) 
7.A7'[0:n/2-1] = (Ar'e) 
8. A7'[n/2:n—1] = Ai'(A,(Ai'e)) 

END 

在 上 面 算法 中 ,和气 阵 的 阶 在 每 一 次 递归 调用 中 减 半 ， 因 此 共 需 执行 O(log 妆 个 递归 步 。 
第 4，5，6 步 用 来 计算 Toeplitz 和 矩阵 和 一 个 向 量 的 乘积 ， 因 而 可 以 利用 EREW PRAM 模型 来 实 


CD 
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现 ， 共 需 处 理 器 数 为 O(n log n)， 执 行 时 间 为 O(log n)。 这 样 ， 共 需 O(log 1) 个 递归 步 来 计算 
下 三 角 Toeplitz 和 矩阵 的 逆 ， 利 用 EREW PRAM 模型 共 需 处 理 器 数 为 O(n log n)， 执 行 时间 为 
O(log’ n)。 


10.8 三 对 角 方 程 组 
在 一 些 科学 实践 中 ， 线 性 方程 组 通常 具有 下 面 的 形式 : 


anXi+ quxs = bi 
Co + GoxXa + Ga = bs 
Qs + Aash3 + Gyx4 = bs 
QaX3 + QuXa + tasxs = bs 


Gn-tn2Nn2 + rt nn + Gain = Ds! 
Qun-HXn-t + Court = bn 
一 般 地 ， 第 ;个 方程 有 如 下 形式 : 
di Xi + t+ imi = b,, 
这 里 1 < i< n。 当 i= 1 或 i = n 时 ,方程 只 有 两 项 。 下 面 我 们 来 看 一 个 n = 6 的 例子 : 
3xi +2x = 1 
Xi+ 2xX; + 4X;=3 
12x,+ 3x;+ 2x=8 
Txs—3xs + 12x;= 2 
2xs+ Sxs+ Xs=4 
xs 一 Xe = 12 
这 里 ,方程 组 可 以 用 和 矩阵 表示 为 : 
32000 0 [入 
1240 0 0||x, 
0123 2 .0 0||x, 
007-3120||x 
00025 1|1x, 
0000 1 -1 \x 12 


注意 ， 系 数 和 矩阵 的 非 零 元 素 只 出 现在 对 角 线 及 次 对 角 线 上 ， 这 样 的 矩阵 称 为 三 对 角 阵 ， 
这 样 的 方程 组 称 为 三 对 角 方程 组 。 


人 iD oo 一 


10.8.1 高 斯 消 元 法 


求 一 个 三 对 角 方程 组 的 解 ， 我 们 通常 可 以 利用 高 斯 消 元 法 消去 下 三 角 元 素 。 由 于 在 每 一 
列 中 只 有 一 个 下 三 角 元 素 ， 因 而 只 需 消 去 这 一 个 下 三 角 元 素 ， 然 后 利用 回 代 法 求解 。 利 用 高 
斯 消 元 法 求 三 对 角 方程 组 的 算法 如 下 : 
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算法 Tridiagonal-G 
输入 : allin, 1:n),b(1:n) 
输出 : x(1:n) 
1. Use Gauss elimination method to reduce the matrix a into an upper triangular matrix 


2. Use Back substitution method now to solve the system 


复杂 度 分 析 ”对 于 每 一 个 行 运 算 ， 所 需 时 间 为 0(n)。 算 法 第 1 步 所 需 时 间 为 0(n”)， 回 代 所 


需 时 间 为 O(n”)。 因 此 在 串 行 方式 下 该 算法 共 需 时 间 为 0(n")。 利 用 CREW PRAM 模 型 ， 共 需 
O(n) 个 处 理 器 ， 执 行 时 间 为 O(n)。 

高 斯 消 元 法 具有 内 在 串 行 性 ， 即 只 有 在 完成 第 一 列 的 行 运算 后 才能 进行 第 二 列 。 以 此 类 
推 ， 此 方法 不 可 能 同时 进行 各 列 的 行 运算 ， 因 此 不 适合 并 行 计算 机 。 下 面 给 出 求解 三 对 角 线 
性 方程 组 的 另 一 种 并 行 化 方法 。 


10.8.2 奇偶 约 化 法 


奇偶 约 化 法 是 将 一 个 方程 组 分 成 两 个 可 以 分 别 并 行 求解 的 子 方程 组 的 方法 。 下 面 我 们 给 
出 一 个 有 16 个 未 知 数 的 三 对 角 方 程 组 的 例子 。 假 定 未 知 数 分 别 为 XX,… Xi。。 给 定 含 16 个 未 
知 数 的 16 元 方程 组 ， 我 们 对 系数 矩阵 作 一 些 算术 运算 ， 当 这 些 算术 运算 完成 后 ， 这 个 方程 组 
被 分 成 如 下 两 个 子 方程 组 : 

子 方程 组 1: 

未 知 数 : XxX,*… Xs 

方程 组 : 含 8 个 未 知 数 的 8 阶 方程 组 ; 

子 方程 组 2: 

未 知 数 : jxsme vs 

方程 组 : 含 8 个 未 知 数 的 8 阶 方程 组 。 

如 果 这 些 子 方程 组 可 以 单独 求解 ， 我 们 可 以 得 到 原来 方程 组 的 解 x Xxx,… xi6。 

为 了 求 每 一 个 子 方 粮 组 的 解 ， 我 们 利用 相同 策略 ， 即 做 某 些 算术 运算 使 得 子 方程 组 1 分 成 
两 个 分 别 含有 4 个 未 知 数 的 更 小 的 方程 组 ， 继 续 这 个 分 化 过 程 ， 直 到 得 到 一 个 仅 含有 2 个 未 知 
数 的 方程 组 ， 并 可 在 0(1) 内 求解 。 

下 面 我 们 更 详细 地 描述 计算 过 程 。 给 定 方程 组 

bixit+ CX =7 
Ca + Dox 十 Cox3 = 7, 
ayx; + byxs3 + CsX4 = rs 
CQ + baxs + Caxs = rs 


axXiit bxit+ CX = 7 


niXn-2 + biXn-! + Cn-iXn 三 Vn- 
Ax + bx, =7, 


ww 
Ww 
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可 以 表示 成 
bxit+cX=r 
axi + DA 二 Coal 三 六 
(i= 2,3,.,(n—1)) 
Qnr + bX = 7, 
如 果 我 们 设 定 哑 元 x。= 0x,,, = 0， 则 有 : 
CQ + bx; + CA = 7 
这 里 1 <i&n。 
第 i-1 个 方程 ， 第 i 个 方程 ， 第 it1 个 方程 分 别 为 : 
di Xis + bi Xi + CX = ri 
CA 二 bxit CXin = 
iski 十 Dix + Ck = Fin 
314 由 第 盖 1 个 方程 ， 得 : 
Xi = ia) 
这 里 ,是 x 和 x;; 的 函数 。 
类 似 地 ， 由 第 i+1 个 方程 得 : 
Xi = 8(XiXi) 
这 里 ，g 是 x 和 xiw 的 函数 。 
将 x 和 x 代入 到 第 ;个 方程 中 ， 可 得 到 关于 x ;, x, ,的 方程 。 
重 置 这 些 方程 的 系数 为 a, b,, c， 右 边 项 为 mr。 引入 三 元 fr = 0, za = 0， 
则 有 
axiz t+ bxitcxw=r, lign, 
即 
axi+ bxit+cX=r 
ayXo + Boxy + Cax4 = Ts 
ayxy + Da + CKs = 方 
Ga + baxa + CaXe = ra 
asxs + bsxs + CX = rs 
aexs + bexe + CoexXs = re 
axxs + bx + Co = ry 
asxe + bexs + Caxio = rg 
上 面 这 个 方程 组 被 分 成 两 个 子 方程 组 。 方 程 1,3,5,… 是 由 ,xs, xs…, xu 组 成 的 方程 组 ， 即 
子 方程 组 1。 方 程 2.4.6…' 是 由 zz, ze x。…,xi 组 成 的 方程 组 ， 即 子 方程 组 2。 如 下 所 示 : 
子 方程 组 1 子 方程 组 2 
aixi+ bxit+cxs=r asxxo + bx + coxa = 7, 


Ca + baxs + CXs = 7 CA + baxa + Caxe = rs 
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asxs3 + bsxs+ CX1 = 方 aexa + bexe + Cexs = ro 


eset 


例 : 运用 奇偶 约 化 法 求 下 面 线性 方程 组 的 解 。 
4x1+X,=2 (1) 
4xi+ llx,—Sx;=7 (G1) 
2xz + 14x-6x=13 (Giii) 
Sx;+ 18x4 = 24 (iv) 
这 里 有 四 个 方程 ， 四 个 未 知 量 。 对 方程 ) ， 要 用 方程 (这 中 的 xs 的 值 来 代替 (i) 中 x 的 值 。 
方程 〈 让 ) 为 
4xi + 11x2 一 xs = 7 
1 
11 


(7—4x, + Sx,) 


XxX; = 


“代入 方程 (i) 中 ,有 


4x + 二 (7-4 +5X3)=2 


即 
5 15 
世 十 一 As 二 一 
11 11 11 
即 
40x1 + 5x; =15 
也 可 以 写成 . 
8x+z=3 (Vv 
这 是 方程 人 新 的 表示 形式 。 
从 方程 (i) 中 解 得 z ， 从 方程 (iii) 中 解 得 x;,， 再 将 x, 和 x; 代 入 (六) 中 ， 可 得 新 方程 
(ii)。 即 


由 (i) x = (2~x2)/4 
由 (iii) x;= (13-2x, + 6xs)/14 
将 x 和 x 代入 (i) 中 ， 得 新 方程 
(2—x,)+llx, -3-24 +6x4)=7 
10x, -2x4=9 (vi 
从 方程 (站) 中 解 得 ， 从 方程 (iv) 中 解 得 x,， 将 雹 和 x 代入 《十 ) 中 ， 得 : 
—24xi + 547x; = 651 (vil) 
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将 方程 (iv) 中 的 x 用 ( 填 ) 中 的 2 来 代替， 得 : 
-10x,+ 282x, = 271 (viii) 
方程 (v) 和 (vii) 构成 子 方程 组 1， 方 程 (vi) 和 (v 这 ) 构成 子 方程 组 2。 


子 方程 组 1 子 方程 组 2 
8x1 + X;= 3 10x,—2x =9 
~24x, + 547x; = 651 ~10x, + 282x, = 271 
上 面 每 个 方程 组 都 含有 两 个 未 知 数 和 两 个 方程 ， 因 此 可 以 立即 得 到 各 方程 组 的 解 。 
子 方程 组 1 子 方程 组 2 





上 面 的 方法 适合 并 行 实现 。 用 O(n”) 个 处 理 器 将 方程 组 分 成 子 方程 组 ， 执 行 时 间 是 常数 时 
间 。 对 子 方程 组 继续 上 面 的 执行 过 程 ， 分 成 只 含有 2 个 未 知 数 的 若干 个 子 方程 组 共 需 O(log 站 
步 。 因 此 总 的 并 行 执行 时 间 是 O(log n)， 处 理 器 数 为 O(n?)， 且 用 CREW PRAM 模型 来 实现 。 
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习题 
10.1 考虑 矩阵 递归 方程 
Y=8B,; 
Y=AY,,+B,(2&ign) 
这 里 4;,，B 是 给 定 的 m x m 和 矩阵 。 设 计 一 个 时 间 复 杂 度 为 O(log n log m) 的 并 行 算法 来 
比较 所 有 的 了.。 
10.2 证 明 : 两 个 nx 下 三 角 Toeplitz 秆 阵 相 乘 所 得 的 矩阵 仍 是 下 三 角 Toeplitz 和 矩阵。 
10.3 设计 一 个 时 间 复 杂 度 为 O(log n) 的 算法 来 计算 两 个 下 三 角 Toeplitz 什 阵 的 乘积 。 


10.4 两 个 任意 的 Toeplitz 第 阵 相 乘 仍 是 一 个 Toeplitz 矩 阵 吗 ? 设计 一 个 算法 来 计算 两 个 
Toeplitz 秆 阵 的 乘积 。 





第 11 章 微分 与 积分 


计算 机 起 初 是 用 于 数值 计算 ， 在 几乎 所 有 的 科学 与 工程 学 分 支 中 ， 数 值 计算 占 主 导 位 置 。 
在 本 章 中 ,我 们 学 习 一 些 重 要 的 数值 方法 并 设计 相应 有 效 的 并 行 算 法 。 首 先 ， 我 们 给 出 最 基 
本 但 又 非常 重要 的 概念 一 一 微分 。 


11.1 微分 
考虑 实 值 函数 fx)， 在 点 xoxix… x 处 相应 的 函数 值 为 ,fi, 记 …, 扩 。 





考虑 如 下 泰勒 级 数 


f(x +=G0)4 让 G+ 入 GD+… 


h h? 
fin WAR (Xi) + 


当 h 非 常 小 时 ， 大 近似 为 零 ， 因 而 有 
大 = 大 + 所， 

这 里 f ;表示 f (x;)， 有 
利用 这 个 公式 可 并 行 求 出 f o,f ,2,…,f,:。 并 行 算法 如 下 : 
算法 Differentiation 
输入 : x(0:n), (0:n),h 
输出 : f(0:n-1D) 
BEGIN 

1. Fori=0 ton-l do in parallel 

2.f ,= fh 

3. End parallel 
END 


复杂 度 分 析 上 面 的 算法 执行 时 间 为 0(1)， 处 理 器 数 为 O(n)， 且 为 CREW PRAM 模 型 。 并 
发 读 操作 是 必要 的 ， 这 是 因为 
处 理 器 已 计算 三 ; 
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处 理 器 Pi 计算 f ;,， 并 且 用 到 #。 
对 于 一 阶 导数 ， 还 有 许多 其 他 公式 ， 这 里 给 出 常用 的 一 个 公式 : 


fi — fi 
/= 2h 
对 于 函数 的 两 阶 ， 三 阶 或 更 高 阶 导数 ， 我 们 给 出 如 下 的 一 些 公式 : 
fr- 7 Ca -28 +1 
f= 天 一 一 们 1 -20_ + 6f., + 4f.,, 一 fs} 


f= 大 仁太 +3 -3f + fa) 


f = {fa +2 2p + fn} 


wy 
尺 
己 


f = 二 一 4j/ 十 6f 一 4fin + fa} 
利用 上 面 这 些 导数 公式 ， 很 容易 设计 并 行 算法 来 计算 高 阶 导数 。 
11.2 偏 微分 


假定 U(x,y) 是 关于 x 和 y 的 函数 ， 要 用 到 下 面 一 些 记号 : 
: U 对 x 的 偏 导 数 ; 
U 对 y 的 偏 导 数 ; 
: UU, 对 x 的 偏 导 数 ; 
: 以 对 7 的 偏 导数 ; 
: UU, 对 x 的 偏 导 数 ; 
wx :对 y 的 偏 导数 。 
同样 地 ， 我 们 可 以 定义 记号 U。,，U,. 等 。 一 般 情况 下 ， 求 导数 的 常用 公式 为 : 


三 


站 


人 SSS 


Yin 一 多 


yi= h 


利用 上 面 的 公式 来 求 U.，U;: 


U(xins yi) ~ U(Xi,y:) 


这 里 h = Xi Xio 
在 上 面 公 式 中 ， 注 意 到 y, 没 有 改变 。 同 样 地 ，U, 表 示 为 
U(x yi) 一 U(Xiy;) 


这 里 kK = ys 一 yo 
我 们 还 可 以 利用 三 点 中 心 公式 





La 
Co 
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得 到 下 面 关 于 UV. 和 ,的 表达 式 

U(X ,y;) 一 U(X. ,1) 
2h 

U(Xi, in) — U(Xi, yi ) 
2k 





U(xi,y;) = 
U, (Xi,y,) 三 


为 简单 起 见 ， 上 面 四 个 公式 可 表示 为 : 





Uiju 一 LU 
”2k 
在 导出 高 阶 偏 导 数 公 式 之 前 ， 我 们 来 观察 二 维 空间 内 关键 点 的 情况 。 
考虑 点 Co 切 ， 它 的 邻 点 如 图 11-1 和 图 11-2 所 示 。 


U 


Yo Yi Yo Ys Ya Ys 


图 11-1 二 维 网 格 






(Xi Yin1) 






(Yi) (XFLYR1) 










(Xit, Yi1) 





图 11-2 网 格 中 的 点 


(11.1) 


(11.2) 


(11.3) 


(11.4) 
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下 面 我 们 推导 已. 的 公式 。 由 前 面 定义 可 知 ，U 表 示 忆 对 x 的 念 导数 ， 应 用 公式 (11.3) 可 得 ; 


Us, jo Us BB 
Us = ee 
再 应 用 公式 (11.4)， 得 : 
U, ,= Ui Ui 
Piri, 2 天 
U, = Ui 一 LU 
2k 


U = 1 J 十 U 一 { J { J ) 
x ph itlj+l i-1J-1 itlj~l ilj+tl 


图 11-3 可 以 帮助 理解 和 记忆 这 个 公式 。 图 中 ， 右 上 角 和 左下 角 的 值 相 加 ， 减 去 另外 两 个 
角 的 值 ， 再 除 以 4hk。 类 似 地 ， 我 们 可 以 导出 如 下 两 个 公式 : 


Uj -2U; + Ui 


Uw 三 
U Uj 一 2U; + Uj 
wi k? 
1,j+1 i+1, j+1 


i-1, j-1 i 计 1, j-1 


图 11-3 Uw 的 计算 图 示 


在 许多 问题 中 ， 常 见 到 表达 式 U, + U,,。 我 们 把 它 记 为 VU， 并 称 之 为 UU 的 拉 普 拉 斯 算 
符 ，V' 称 为 拉 普 拉 斯 算 子 (Laplacian operator)。 
ViU =U, +U, 


利用 Ui 和 UU 的 值 ， 我 们 可 以 得 出 YU; 的 公式 。 选 取 h ==， 得 : 
ViU;, 一 二 (Un 十 La 十 Ui 十 Un 一 4U;) (11.5) 


对 于 下 列 给 定 的 函数 ， 我 们 可 以 求 出 YU 在 (1.5, 2.0) 处 的 值 。 


CD 
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YU 的 公式 图 解 见 图 11-4， 图 中 四 边 的 值 相 加 再 减 去 中 心 值 的 4 信 。 


1 
ViU,; 三 pee + Ui + Ui + Uiji 一 4U,) 





图 11-4 拉 普 拉 斯 算 子 


VU,=15+23+13+16-4x14=11 
V’U,=15+27+14+19-4x16=11] 
我 们 可 以 设计 并 行 算法 来 计算 Us(1<i<m,1<j<n)。 由 上 面 公式 可 知 ， 对 所 有 的 浅 WJ 均 可 
实现 并 行 计算 。 
算法 Laplace 
输入 : U[0:m, 0:n] 
输出 : VU[l:m-1,i:n-1] 
1. For i= 1 to m-1 do in parallel 
2. For j= ito n-l do in parallel 
3. Calculate V’U,, using the formula 
4. End parallel 
5. End parallel 
325 上 述 算法 共 需 处 理 器 数 为 O(nm) ， 执 行 时 间 为 0(1)。 由 公式 知 ，Uiwj 被 用 于 计算 Y_ Un， 
同时 也 要 计算 V: Us,。 因 此 ， 需 要 用 并 发 读 PRAM 模 型 ， 即 CREW PRAM 模 型 来 实现 。 
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11.3 定 积分 


考虑 实 值 函数 y = f(x)， 定 义 域 为 [a,b]。 积 分 矿 ftx)dx 表 示 函 数 flx) 与 x* 轴 及 x = a, x = 5 所 转 
区 域 的 面积 。 
当 (b-q) 非 常 小 时 ， 这 个 面积 近似 等 于 上 下 底 分 别 为 Ka),fb)， 高 为 (b-q) 的 梯形 面积 。 因 此 有 : 


(b- Vf(a) + f(D)) 
2 


area = 
即 


f° fdx= 2 + f(a+h)) 


这 里 的 4 非常 小 ， 这 个 公式 称 为 梯形 法 则 。 仅 当 h 非 常 小 时 ， 这 个 法 则 给 出 合理 的 值 。 如 
图 11-6 所 示 。 
现在 假定 我 们 要 计算 积分 三 faodx， 这 里 (p-a) 并 不 很 小 。 我 们 将 区 间 [a 光 分 成 若干 个 相等 
的 小 子 区 间 : 
人 SS 
其 中 zx,-xz = (p-a =h(0<ign) ( 见 图 11-5)。 要 使 = (5b-a)/n 足 够 小 ，n 必 须 取 足 够 大 。 


a b 
Xo X， X。 Xs Xn X, 


图 11-5 区 间 [a,b] 被 分 成 n 等 分 


y 轴 





Xo X! X> Xn-2 Xn Xn X 轴 


图 11-6 梯形 法 则 


和 DE 
fx)dx= 7 


Xi 


4) 
h 
ey (f(xi) +f (xi+ h)) 


b xn 
| FdX= | f(x)dx 
a x0 


LD 


个 
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-| | tear+ | + f(x)dx 
Xo Xl Xn-1 
h h 
= 了 {f(x0) +f(x1)} + 3 {f(x1) + f(x2)} + 


h 
+ 7 {fC D+f0n)) 


如 图 11-6 所 示 。 完 整 的 算法 如 下 : 

算法 Integral-Trapezoidal 

输入 : 函数 f/x), a,b,n 

输出 : Integral = fx)dx 
1.h=(b~a/n 
2. For i =0 to ni do in parallel 
3.x,=a+ih 


4. Integral( = SC,) + f(x, + 站) 


5. End parallel 
6. Evaluate integral = > integral (7) 


第 2 ~ 5 步 共 需 处 理 器 O(n)， 执 行 时 间 为 0(1)。 第 6 步 求 和 运算 占用 了 主要 时 间 ， 所 需 处 理 
器 数 为 0(n)， 执 行 时 间 为 0(Uog wn)。 在 第 2 ~ 5 步 中 被 同时 用 于 所 有 的 处 理 器 ， 因 此 并 发 读 操 
作 是 必需 的 ， 而 并 发 写 操作 不 是 必需 的 。 需 要 用 CREW PRAM 模 型 来 实现 。 

为 了 求 小 子 区 间 的 积分 值 ， 我 们 给 出 一 些 近似 公式 。 其 中 ,辛普森 1/3 法 则 比较 好 。 

辛普森 13 公 式 为 : 


万” fdx = Sf (x)+4f(x, +h) + fx, +2h)) 


为 了 计算 积分 ， 区 间 [e, 忆 必须 分 成 2 个 相等 的 子 区 间 。 
h=(b-a)/2n 
X= atih 
下 面 我 们 给 出 应 用 辛普森 1/3 法 则 计算 积分 的 完整 算法 : 
算法 Integral-Simpson 
输入 : 函数 Kx), a, 5,n (其 中 n 为 偶数 ) 
输出 : 积分 人 Ax)dx 
1.h= (5b~a)/2n 
2. For each i € {0, 2, 4, 6, 8:……(n—2)} do in parallel 
3.x=a+ih 
4. Integral (7) = h/3 {f(x) + 4f(x; + h) + flx, + h)} 
5. End parallel 
6. Evaluate Integral = 3 Integral (i), where sum is taken over all i € {0, 2, 4,…(n~2)} 
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很 容易 判断 出 此 算法 所 用 的 处 理 器 数 为 0(n)， 总 的 执行 时 间 为 O(log n)， 且 用 了 CREW 
PRAM 模 型 来 实现 。 


11.4 ”插值 


已 知 范 数 Ax)， 以 及 其 在 点 x， 2 Xn 处 的 函数 值 fxo), x1), f(x),… ,fAX,)。 点 x 不 同 于 x。， 
区 MX 上 且 fx) 未 知 。 
由 已 知 的 函数 值 Kxo, fx)),Kx2)…, fx,) 来 求 Ax) 的 近似 值 ， 这 种 方法 称 为 插值 。 


WT ED 

上 表 表 示 不 同时 间 以 及 相应 的 温度 值 。 开 始 时 温度 为 15C ， 当 温度 达到 20C 时 ， 时 间 是 
10 秒 ; 当 温 度 达 到 30C 时 ， 时 间 是 32 秒 ; 当 漫 度 达 到 50C 时 ， 时 间 是 128 秒 。 我 们 感 兴趣 的 是 
当时 间 为 100 秒 时 的 温度 ， 即 当 x = 100 时 K100) 的 值 。 


Ta 




















11.4.1 线性 插值 
设 wx 是 两 个 点 ,ff 是 相应 的 函数 值 ，x 是 介 于 x 和 ,之 间 的 任 一 点 。 我 们 要 从 fx) 和 fx) 
来 求 fx)。 
考虑 泰勒 级 数 : 
f= f+ TG -x+ 


仅 考虑 最 前 面 两 项 ， 则 : 

f = + f (Xo -Xo) 
因而 有 f (x)=(f — fh) AX — Xo) + 
x 点 处 的 泰勒 级 数 为 : 


f (Xo) 
l1 





f(xX)= f(x0)+ (Xi — Xo) + 
仅 考虑 最 前 面 两 项 ， 则 : 
f(x)= hn +f (x(x-x)=h + 


设 (Xxx0)/(X1~X0) =p， 则 有 : 


(fi -NX Xo) 


(Xx, — Xo) 


f(x)= f+(f-f)p 
=(1-p)h+ph 


wy 
‘© 


Ww 
oo 
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上 面 的 公式 称 为 线性 插值 公式 。x 介 于 xz 与 3 之 间 ，p 是 一 个 非 负 分 数 ， 即 p 满 足 : 0<p <1。 
计算 ”给 定 %x1， 甩 ,有 ， 给 定 x，Ax) 未 知 。 首 先 求 p = (x 一 xo)/(x1-xo)， 然 后 使 用 Ax) = (1-p) 
矿 + ph， 求 出 fx)。 例如， 考虑 如 下 函数 : 


假定 求 值 K10)。 
这 里 

X=7, x= 19 

f=15, f=35 

x=10 
因此 有 

p= (x-xo)/(x1—x0o) = (10-7)/(19-7) = 0.25 
1-p =0.75 
AI0) = (1-p)h + ph = 
11.4.2 二 次 插值 


设 x_ XX ,是 三 个 点 且 满 足 
XX 二 一石 三 大 


-iff 是 相应 的 函数 值 。x 是 介 于 x 与 x 之 间 的 点 。 








由 泰勒 级 数 
f=f0)+ er- + 
只 取 前 三 项 ， 并 且 用 下 面 的 式 子 来 代替 f(x) 和 f(x)。 
ro -在 
f wk, -2f.+f.) 
得 : 


f(x) = -2 PD +(1- p+ ee, 
这 里 p= (x-X)/h。 和 们 千 黄 为 二 次 搓 信 全 碟 。 
11.4.3 拉 格 朗 日 插值 


假定 函数 Kxz) 在 一 些 给 定 的 点 x 上 的 值 是 已 知 的 《区 间 不 必 相 等 )。 


EC 
所 
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函数 值 在 点 Xox1,x;,… ,x 处 是 已 知 的 ， 我 们 设法 构造 一 个 关于 x 的 n 次 多 项 式 fx)， 且 满足 
fx) = f( 已 知 )。 


考虑 多 项 式 
P00)= -CE JI 一 三 DC 一 Xe 
(x -Xo 一 六 一 ki Nx Xin MX — x,) 
px) 0 让 ix 大 
a -| 认 = 天 


这 里 k= 0,1;2,…,n。 我 们 得 到 如 下 多 项 式 : 
fx) = foPo(x) +Jpi t+ P(x) 
Ax) =f(0&ign) 

这 个 公式 称 为 拉 格 朗 日 插值 公式 。 

算法 设计 nn 是 插值 点 个 数 ,， 在 插值 点 处 的 值 已 知 。 

插值 点 : 和 7 

相应 的 f 值 : ff,… ,了 

想 要 求 函 数 / 在 y 点 的 值 fy)。 在 下 面 算法 中 用 /表示 Ay)。 拉 格 庚 日 插 值 算法 如 下 : 

算法 Lagrange 

输入 : x(1:n),A1:n),y 

:hp 

Fork=l1ton 

P.=1 

Fori=1tondo 


蕊 
压 


Ifi=k go to step 6 
已 = Pi*(y—X)/(x—Xi) 


next 


Po oom- 


La 


For i=l] ton do 33 
10.f=f+P.f 


ll. nexti 
12. END 
拉 格 朗 日 插值 并 行 算法 上面 算 法 的 第 1 ~ 7 步 计 算 PA0 <k< n) 的 值 ， 且 可 以 并 行 化 。 每 
个 P 值 的 计算 需要 O(log ) 时 间 ， 处 理 器 数 为 0(n)， 并 用 EREW PRAM 模型 来 实现 。 第 9 ~ 11 
步 计算 # 的 值 ， 也 需要 O(n) 个 处 理 器 ， 执 行 时 间 也 是 O(log w)。 拉 格 朗 日 插值 并 行 实现 的 总 时 
间 为 O(log n)， 处 理 器 数 为 O(n)。 
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习题 
11.1 用 Monte Carlo 法 设计 一 个 算法 、 求 从 a 到 b 的 函数 积分 。 
11.2 用 差分 法 设计 一 个 求 函 数 微分 的 算法 。 
11.3 什么 是 牛顿 插值 7 求 其 并 行 复杂 度 。 


11.4 设计 一 个 并 行 过 程 ， 用 把 (a,b) 分 成 a 个 区 间 的 五 点 中 心 公 式 求 从 a 到 5 的 函数 积分 。 
11.5 设计 一 个 并 行 过 程 ， 用 差分 法 求 函数 的 三 阶 导数 。 





第 12 章 微分 方程 
12.1 欧 拉 公式 


考虑 如 下 微分 方程 : 


初始 条 件 为 y(xo) = yo。 点 Xo, Xi, XxX,…， 多 满足 x = xXx:+h， 且 y; = y(x,))。 由 于 初 值 给 定 ， 我 们 
把 这 一 问题 称 为 初 值 问 题 。 


由 泰勒 级 数 
hh , 
Yin = “六 “人 二 
当 有 非常 小 时 ， 如 可 以 忽略 不 计 ， 因 而 有 
yi = y+ hy 
给 定 y =Ax,y)， 由 上 式 ， 可 得 : 
ym = y+ hf 


这 里 表示 flxiy)。 

上 式 称 为 求解 初 值 问 题 的 欧 拉 公式 。 由 于 y 给 定 ， 使 用 欧 拉 公 式 可 求 得 y,， 即 y, = yothfo; 
再 由 及 欧 控 公式 可 求 得 y,， 即 y, = y,+hf。 重 复 这 个 过 程 ， 我 们 依次 可 以 求 出 yy…,y,。 由 
以 上 讨论 可 知 ， 这 个 方法 是 内 在 串 行 的 ， 将 其 并 行 化 是 不 可 能 的 。 同 样 ， 对 于 初 值 问题 ， 存 
在 许多 算法 其 本 身 具 有 内 在 串 行 性 。 下 面 我 们 考虑 偏 微分 方程 。 


12.2 偏 微 分 方程 
设 x;y 是 两 个 变量 ， 由 函数 U(x,y) 及 U 对 xy 的 偏 导数 组 成 的 方程 称 为 偏 微分 方程 。 例 如 : 


U, +U, +x’ sinxU, =e”” cos (xy) 

是 偏 微分 方程 。 偏 微分 方程 中 最 高 阶 导数 的 阶 数 称 为 偏 微分 方程 的 阶 。 在 研究 中 ， 二 阶 
偏 微分 方程 是 最 重要 的 一 类 偏 微分 方程 。 在 许多 物理 和 工程 计算 中 经 常 遇 到 求解 二 阶 偏 微分 
方程 的 问题 。 

二 阶 偏 微分 方程 的 一 般 形 式 为 : 

AU,. + BU, + CU,=F 

这 里 F 是 xyy,U,U.,U, 的 函数 。 

根据 4,B,C 的 值 ， 上 述 方程 可 分 为 如 下 三 种 类 型 : 

如 果敢 -44C < 0， 方 程 称 为 柱 圆 方程 ; 

如 果 B?-4AC = 0， 方 程 称 为 抛物 方程 ; 


Ww 
mn 





ULD 
CD 
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如 果 B'-44C > 0， 方 程 称 为 双 曲 方程 。 
一 些 标准 的 二 阶 偏 微分 方程 如 下 表 所 示 : 


UaU,=0 A= -a,B=0,C=0, 
B44AC = 4a: >0, 


双 曲 型 


热传导 方程 ， A=k,B=0,C=0, 
B’'~4AC = 0， 


抛物 型 


拉 普 拉 斯 方程 A=1,B=0,C=1, 
B'-4AC = -4<0, 


椭圆 型 


U,+ U,= F(xy) 椭圆 型 





为 了 描述 这 个 分 类 ; 让 我 们 把 下 面 方程 归 类 为 抛物 型 ， 椭 圆 型 和 双 曲 型 。 
1. 2f. -4fo+f, =(l+x )(-y) 
2. CIDf + Ny f+tx)ff, x>0,0<y<l 
3. (1—-x’)U, +2yU, +U,=0 
首先 ， 考 虑 方程 
2f. -4f,+f, = (+x’)(1-y’) 

这 里 4=2, B=-4, C=1,，B'-4AC = 16-8 =8 > 0。 因 此 它 是 双 曲 方程 。 
现在 考虑 第 二 个 方程 

(IDS + Ny ft tx ff 


这 里 A4 和 8B 不 是 常数 而 是 x,y 的 函数 ， 其 中 A = /4, B= dl-y ,C=1,B-44AC = 1-y’~x’。 
因此 当 xi+y > 1， 方程 是 椭圆 型 的 ， 当 x?+y? = 1， 方 程 是 抛物 型 的 ; 当 z2+ 六 < 1， 方程 是 双 曲 
型 的 。 

为 了 对 这 个 方程 有 更 好 的 认识 ， 我 们 考虑 二 维 平面 上 的 单位 圆 。 

给 定 0 < y < 1， 区域 位 于 y 轴 和 垂 线 y = 1 之 间 。 在 单位 圆 内 部 ， 方 程 是 双 曲 型 的 ， 在 单位 
圆 外 部 ， 方 程 是 椭圆 型 的 ; 在 单位 贺 上 ， 方程 是 抛物 型 的 。 

考虑 第 三 个 方程 (1-xz]U.。 + 2yUs, + U = 0， 这 里 4 = 1-x, B = 2y, C= 1,B’-4AC = 
402+y2-1)。 当 2 + y-1 < 0 时 ,方程 是 椭圆 型 的 ， 当 x? + yy-1 = 0 时 ， 方 程 是 抛物 型 的 ; 当 
2+72-1 > 0 时 ， 方 程 是 双 曲 型 的 。 


12.3 抛物 方程 


最 常见 的 抛物 方程 是 热传导 方程 ， 形 如 
CU,=U, 
我 们 在 矩形 区 域 [ai,a;] x [5b.,b,] 内 解 上 述 方程 o 将 [a ,4,] 分 成 m 个 相等 的 子 区 间 3» [51,5;] 分 成 
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?个 相等 的 子 区 间 。 令 
X=artih, y= b+jk 


图 12-1 区 域 及 方程 类 型 
这 里 


如 图 12-2 所 示 。 为 方便 起 见 ， 记 作 
U,= U(xiny)) 
我 们 是 要 求 0,, 其 中 1 <i < ml <j&<n。 





图 12-2 二 维 网 格 
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12.3.1 施 密 特 法 (求解 抛物 方程 ) 


338 给 定 抛物 方程 
CU = U, 
应 用 微分 公式 ， 得 : 
Ua =(L-2r)0 +rC + Un,) 


其 中 + = cb 天。 上 述 表 达 式 称 为 苑 密 特 公式 。 如 图 12-3 所 示 。 





图 12-3 施 密 特 法 
例 求解 网 格 内 点 中 的 抛物 方程 以 = 1/20U..， 且 有 AP = 0.2, 上 = 0.2，xE[0,1]，yE [0,1]。 





图 12-4 施 密 特 公式 


U, = 1/20U,. 
这 里 c = 1/20， 初 始 条 件 为 : 
U(x,0) = 1+x’ 
xo=0,h=0.2,y =0,k=0.2 
r=ck/h:= 1/4 
Uijn = (1- 27r)U; +r(Uiij+ Uin,) 
=1/2U, +1/4(U;,; + Uin,) 
妈 ]: 


Uiju =1/4(2U; + Ui + Uin,j) 


340 上 述 公式 如 图 12-4 所 示 。 在 x 轴 上 取 节 点 分 别 为 x = 0,0.2,0.4,0.6,0.8,1.0。 在 y 轴 上 取 节 点 分 
别 为 y = 0,0.2,0.4,0.6,0.8,1.0。 网 格 如 图 12-5 所 示 。 
使 用 给 定 的 初始 条 件 U(x,0) = 1 + 区， 我 们 可 以 计算 y = 0 上 所 有 点 的 值 。 
Uo= UO00)=1 Us,= U(0.6,0)= 1.36 
Us=U(0.2,0)=1.04 Us= U(0.8,0)= 1.64 
Uo=U(0.4,0)=1.16 VU;s= U(1.0,0)=2 





0.8 
0.6 
0.4 


0.2 


0 02 04 06 08 10 
图 12-5 节点 与 网 格 


利用 这 些 点 的 值 ， 并 结合 施 密 特 公式 
Ujn =1/4{U, +2U + Uin,] 


可 计算 Ui, Uy, Uy, Us 
求 U,, ( 见 图 12-6a): 
Li = 1/4{Uoo + 2U10 + U,o} 
= 1/4{1 + 2(1.04)+1.16} 
= 1.06 
求 U,,( 见 图 12-6b): 
Ui = 1/4{Uio + 2U,o + Uso} 
= 1/4{1.04 + 2(1.16)+1.36} 
=1.18 
求 U，( 见 图 12-6c): 
Us = 1/4{U,o + 2Uso + Uso} 
= 1/4{1.16 + 2(1.36)+1.64} 
= 1.38 
求 UU,, ( 见 图 12-6d ): 
Us = LU4{U +2U + Uso} 
= 1/4{1.16 + 2(1.36)+1.64) +2} 
=1.66 





图 12-6 
a) Ui, 的 计算 
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U20= 1.16 


b) 





图 12-6 ( 续 ) 
b) UU 的 计算 c) LU 的 计算 d) U4 的 计算 


求 出 Ui,(i= 1,2,3,4) 后 ， 我 们 来 求 U.(i = 2,3)。 
求 U,;( 见 图 12-7a): 
U,,= 1/4{U 1 +20 + Us,} 
= 1/4{1.06 + 2(1.18)+1.38} 
= 1.2 
求 U;;,( 见 图 12-7b): 
Us = 1/4{U +2L + Usa} 
= 1/4{1.18 + 2(1.38)+1.66} 
=1.4 





图 12-7 
a) Ua 的 计算 





务 12 童 彼 分 方程 245 





图 12-7 ( 续 ) 
b) U,; 的 计算 


下 面 给 出 求解 热传导 方程 的 算法 : 
CU,= U, 
y(x,b1) = AV) 
U(aiy) = g1(y) 
U(qas;y) = 8:()) 
算法 Heat Flow 
1. Define A(x), 8.(y), 8.()) 
2. Read ai, a;, bi, b,c, m,n 
3.h= (@-a)/m, k= (6b,~b)/n 
4.r= ck/h’ 
5. xo = ai, yo = b', Uo = f(xo) 
求 初 值 : 
6.Fori=ltom 
7.x=X0t+ih 
8. Uio = f(x) 
9. nexti 
10. Forj =1 ton 
ll.y=y +jk 
12., Uo, = 8 
13. U,, = 82(7)) 
14. nextj 
启用 施 密 特 公式 : 
15. For j=l ton 
16. For i =0 to m-2 
17. U = (1-27)U, + TU + Uin)) 
18. nexti 
19. nextj 


施 密 特 法 的 并 行 实现 
上 述 申 行 算法 中 ， 第 6 步 到 第 9 步 的 for 循 环 可 以 并 行 化 如 下 : 
6. For i= 1 to m do in parallel 
7.x=X+ih 
8. Uio = fx) 
9. End parallel 





ww 
a 
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同样 ， 第 10 步 到 第 14 步 也 可 以 并 行 化 如 下 : 
10. For j= 1 to n do in parallel 
ll.y= y+jk 
12. Uo = SO 
13. = 829)) 一 
14. End parallel 
END 
施 密 特 公式 应 用 是 从 第 15 步 开始 的 。 由 于 所 有 的 ;可 并 行 化 ， 因 而 第 17 步 可 并 行 计算 。 第 
16 步 到 第 18 步 可 写成 : 
16. For = 0 to m—2 in Parallel 
17. Ui = (1-2rD + r(U; + U,,)) 
18. End parallel 
在 施 密 特 法 中 ， 求 第 j+1 层 的 U 值 只 用 到 第 j 层 的 U 值 ， 即 U 值 是 一 个 接 一 个 串 行 计算 的 ， 
因此 第 15 步 的 for 循 环 不 可 能 并 行 化 。 
在 上 面 的 讨论 中 ， 第 6 ~ 9 步 和 第 10 ~ 14 步 分 别 用 的 处 理 器 数 为 O(m) 和 O(n)， 执行 时 间 均 
为 0(1)。 第 15 ~ 20 步 所 用 的 处 理 器 数 为 O(m)， 执 行 时 间 为 O(n)。 


12.3.2 Laasonen 法 (求解 抛物 方程 ) 
Laasonen 法 对 U, 用 如 下 公式 : 





对 给 定 的 抛物 方程 (热传导 方程 )， 使 用 这 个 公式 ， 可 得 : 
CU + Us}- (+27)U; = 一 


这 里 r = cK/ 
这 个 公式 称 为 aasonenr 法 。 如 果 对 所 有 的 值 ，V- 已 知 ， 则 用 上 面 的 公式 可 得 到 关于 Lv 
U,,,… 的 线性 代数 方程 组 。 通 过 求解 方程 组 ， 可 得 到 UU,, U,,,… 的 值 。 


例 求解 抛物 方程 
20U,= UsU(x0)=1+x, 0x«0.6 
Lo = 1(y > 0), U(0.6;y) = 1.36(y > 0) 

h=0.2, k=0.2 

给 定 的 方程 为 
U, -Lv 
20 
这 里 
c=—, k=0.2, h=02 


hh? 20004) 4 
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因此 ，Laasonen 公 式 变 为 


即 
Lv 一 6U, + Lv 二 -4U,,, 


考虑 图 12-8 所 示 的 网 格 点 ， 沿 着 x = 0 和 x = 1 上 的 网 格 点 的 值 全 都 为 零 ( 给 定 的 )。 
沿 着 x 轴 上 的 网 格 点 的 值 可 由 函数 U(x,0) = 1 + 忆 计 算得 到 。 


10 5 
08 4 
06 3 
0.4 2 


0.2 1 


0.0 0.2 0.4 0.6 
图 12-8 网 格 点 


Di ,= U(0.2,0) = 1.04 
U,s= U(0.4,0)= 1.16 
U,, = U(0.6,0) = 1.36 


Uj= 1,j=0,1,2, 
Us = 1.36,j = 0,1,2,… 
我 们 已 求 得 网 格 中 左 侧 、 右 侧 和 下 边界 的 U 值 。 在 上 面 的 公式 中 ， 取 i = 1,j = 1， 则 可 得 


( 见 图 12-9): 
Uw-6U, + U2 = -4U'o 





图 12-9 Laasonen 公 式 
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图 12-10 Crank Nickolson 法 


在 上 面 的 公式 中 ， 取 i = 2,j= 1， 则 可 得 : 
Ui~6U1 + Us = -4U,o 
又 有 Du = 1,U31 = 1.36, Uio= 1.04, Uo = 1.16, 则 上 面 两 个 方程 变 为 : 
-6U + Us =5.16 
Lu-6U = -6 

求解 并 可 得 : LU = -1.056, U,, = 1.176。 

同样 ， 取 (iy) = (1,2),(iy) = (2.2), 可 得 到 关于 局 和 局: 的 线性 代数 方程 组 。 通 过 求解 可 得 
U,; 和 U;; 的 值 。 重 复 以 上 过 程 可 求 得 VU,, 和 U0 > 2) 的 值 。 


12.3.3 Crank Nickolson 法 


根据 施 密 特 法 > 我 们 有 r(Uin,-2U,, + UL) 三 Un— Uijo 

根据 Laasonen 法 ， 如 果 用 点 (ij+1) 来 代 赫 (ij)， 则 有 : 
r(Uim -2 Ui + U1) = Uia—Ui, 

上 述 方程 右边 的 值 等 于 两 个 方程 左边 值 的 平均 值 ， 则 有 : 


r r 
IC 一 2U; + U,)) + FU 一 2U， 十 Uijn) = (Uiju 一 U,) 


r r 
3 Uw + CU) 十 (1 一 nv,, = 本 (Cn 十 Un) + (1 + nDU,ja 


上 述 方法 叫做 Crank Nickolson 法 。 用 这 个 方程 可 以 组 成 一 个 线性 代数 方程 组 。 
在 给 定 的 热传导 方程 中 ， 使 用 公式 


可 以 推导 出 施 密 特 法 。 使 用 公式 





可 以 得 到 Laasonen 公 式 。 利 用 平均 值 技 术 ， 可 以 得 到 Crank Nicholson 法 。 我 们 可 以 由 Ui,, -iv 
U,,, 等 来 计算 Ut。Uj(i = 0,1,2) 位 于 第 层 ， 利 用 这 三 种 方法 和 第 j 层 上 的 值 ， 可 以 求 出 第 j+1 
层 上 的 值 。 因 此 这 三 种 方法 都 是 两 层 的 。 施 密 特 法 给 出 Uj, 的 显 式 公式 ， 其 他 两 种 方法 给 出 在 
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第 +1 层 上 的 U0 的 隐 式 关系 式 。 通 过 这 些 关 系 式 ， 我 们 可 以 构造 线性 代数 方程 组 并 求 出 在 第 ji+1 
层 上 U0 的 值 。 因 此 ， 施 密 特 法 称 为 显 式 方法 ， 而 Laasonen 和 Crank Nicholson 法 称 为 隐 式 方法 。 


12.3.4 三 展 差分 法 
考虑 三 点 微分 公式 


对 于 抛物 方程 CU, = U..， 使 用 这 个 公式 ， 有 
2ck 
h’ 
这 个 公式 称 为 Richardson 公 式 。 在 这 个 公式 中 要 计算 第 讶 1 层 上 点 的 值 ， 就 要 用 到 第 j 层 和 
第 j=-1 层 的 值 。 因 而 Richardson 公 式 是 一 个 三 层 差 分 法 。 
考虑 Richardson 公 式 





{ 一 2U; + Uin,} = Ui 一 LA 


La = Uj + 2r{U,, 一 20, + Uiny} 


我 们 用 如 下 UV, 的 表达 式 来 代 赫 等 式 右 边 Ui, 的 值 。 
v= Uj i 
得 到 : 
Un = Us +2r{U, -DUO 
(1+2)U,, = (1 -2)0,, +2r{U,,, + Un,} 
1-2r 2r 
这 个 公式 称 为 Dufort-Frankel 法 。 注 意 Richardson 和 Dufort-PFrankel 法 都 是 显 式 方法 。 
下 面 我 们 设计 一 个 算法 来 求解 热传导 方程 
CU,= U, 
用 Dufort-Frankel 法 求解 ， 假 定 初始 条 件 已 经 给 出 : 
U(X,b1) = f(x) 
U(aiy) = 810) 
U(as;y) = 820)) 
由 于 Dufort-Frankel 法 是 三 层 差分 法 ， 在 计算 Us (i = 12,…) 之 前 ， 我 们 需要 知道 Uo, Ui 的 
值 。 用 施 密 特 法 求 以 ,的 值 。 算 法 如 下 : 


算法 Dufort-Frankel 
1. define f(x) 
2. define g(x) 
3. define g,(x) 


4. read a,, @;2, bi, bs, m,n,c 


Uj = 


jt 
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5. 有 = (a,~a)/m, k= (b,-bi)/n 
6.r= ck/h 
7. Xo = a1; yo = bi Uno = 82(y0); Uoo = f(xo) 
/计算 Us 的 初 值 */ 
8. For z =1 tom 
9.x=X0t+ih 
349 10. Lo = fx) 
ll.nexti 
放 根 据 已 知 条 件 计算 U6, 和 UU,,*/ 
12. Forj =] ton 
13.y = y + 大 
14. Uo, = SO 
15. U,, = 82(9)) 
16. nextj 
用 施 密 特 法 计算 Ui: 
17.Fori=1tom-!l 
18.U,, = (1-27)U,o + r(U,io + LU) 
19. next i 
启用 Dufort-Frankel 法 : 
20. For j= 1 to 7 一 1 
21.Fori=1tom-l 
22. Ui = ((1-27)U + (2r/(l + 27){ Ui + Uiny} 
23. Nexti 
”24. Nextj 
END 


Dufort-Frankel 法 的 并 行 化 ”在 串 行 算法 中 ， 第 8 ~ 11 步 可 以 并 行 化 ， 第 12 ~ 16 步 也 可 以 
并 行 化 ， 因 而 第 8 ~ 16 步 可 以 写 为 : 


.Forj= 1 ton do in parallel 


Oo 


9.x=Xx0t+ih 
10. Uo = f(x) 
11, End parallel 
12. Forj = 1 to n do in parallel 
13.y;= yo + jk 
14. Uo, = 8 
15. Un = 82O 
16. End parallel 


350 第 17 ~ 19 步 用 施 密 特 法 计算 以 ,的 值 ， 也 可 以 将 其 并 行 化 为 : 


17.Fori = ltom-l1doinparallel 
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18. Ui = (1-27)Uio + Do+ Unio} 
19. End parallel 


Dufort-Frankel 法 利用 U 在 第 j 层 和 第 j-1 层 的 值 来 计算 Ui,,,。 第 22 步 也 可 以 并 行 化 。 但 第 20 
步 的 for 语 句 不 能 转换 成 并 行 语句 。 第 20 ~ 25 步 可 以 重新 写 为 : 
20. Forj=1ton-! 
21. Fori= 11tom-l do in parallel 
22. Ui = ((1~27N/(1+27) Us + (2rA(1 + 2r){ Ui + Uy} 
23. End parallel 
24. Nextj 
25. Stop 
END 
在 并 行 操作 中 , 第 8 ~ 11 步 、 第 12 ~ 16 步 、 第 17 ~ 19 步 所 用 的 处 理 器 数 分 别 为 OUm)、0O(n)、 
O(m)， 执 行 时 间 为 0(1)。 第 20 ~ 26 步 所 用 的 处 理 器 数 为 O(m)， 执 行 时 间 为 O(n)。 第 22 步 利用 
Ui 来 计算 U,,,。 由 于 这 一 步 是 并 行 操作 ， 要 用 CREW PRAM 模 型 来 实现 ， 因 此 这 一 算法 采用 
CREW PRAM 模 型 。 
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第 1 章 
1.7 环 状 网 


如 果 把 线性 数组 网 络 的 两 端 连 接 起 来 ， 就 得 到 如 图 A-1 所 示 的 环 状 网 。 
对 于 一 个 有 7 个 节点 的 环 ， 其 直径 为 w2， 且 是 度 为 2 的 正则 图 。 


O 





4 
图 A-1 环 状 网 


1.8 “” 藤 环 网 络 


在 环 状 网 中 增加 额外 的 连接 ， 使 得 图 变 成 度 为 3,4… 的 正则 图 ， 就 得 到 弦 环 网 络 。 例 如 ， 
一 个 度 为 3 的 弦 环 网 络 在 图 A-2 中 给 出 。 
在 这 个 例子 中 ， 有 两 个 节点 标记 为 0, 1, 2, 3,…, (2'~1)。 每 个 奇数 节点 i 都 和 一 个 偶数 布点 
jj 连接， 其 中: 
j=i+3(mod 29) 
例如 : 
1 和 4 连接 ; 
3 和 6 连接 ; 
5 和 8 连接 ; 
7 和 10 连 接 ; 
9 和 12 连 接 ; 





11 和 0 连接 ; 
14 和 2 连接 。 





图 A-2 度 为 3 的 弦 环 网 络 


一 个 度 为 4 的 弦 环 网 络 在 图 A-3 中 给 出 。 这 可 以 通过 在 环 状 网 中 增加 额外 的 度 得 到 。 每 个 
节点 i 都 和 i+4(mod 4) 相 连 。 





图 A-3 度 为 4 的 获 环 网 络 
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1.9 Barrel Shifter 网 络 


Barrel Shifter 网 络 是 通过 在 环 状 网 中 增加 以 下 额外 的 连接 得 到 的 : 
每 个 节点 i 都 和 与 其 距离 为 2 的 蜂 次 方 的 节点 j 连接 。 即 节点 i 和 所 有 与 其 距离 为 2，4，8， 
16，… 的 节点 连接 。 例 如 ， 考 虑 有 16 个 分 别 标记 为 0，1，2，3，…，15 的 节点 的 环 状 网 。 其 
中 ， 节 点 0 已 经 与 1 和 15 连 接 ; 节点 2 和 14 与 0 的 距离 为 2， 因 此 节点 0 与 2 和 14 连 接 ; 节点 4 和 12 
354] “与 0 的 距离 为 4， 因 此 节点 0 与 4 和 12 连 接 : 0 和 8 之 间 的 距离 为 8， 因 此 它们 之 间 相连 接 。 因 此 在 
Barrel Shifter 网 络 中 ， 节 点 0 与 节点 1，2，4，8，12，14 和 15 相 连接 。 相 似 地 ， 节 点 1 与 节点 2， 
3，5，9，13，15 和 0 相连 接 。 这 些 在 图 A-4 中 给 出 。 


15 


14 


10 
9 a 


图 A-4 有 15 个 节点 的 Barrel Shifter 网 络 (只 给 出 了 节点 0 和 1 的 连接 ) 


1.12 立方 体 连接 环 


通过 把 上 立方 体 中 的 每 个 节点 替换 成 上 - 环 ， 就 得 到 了 大 立方 体 连 接 环 (k-CCC)。 例 如 ， 考 
虑 图 A-5 中 给 出 的 3- 立 方 体 。 通 过 把 3- 立 方 体 中 的 每 个 节点 替换 成 3- 环 ， 就 得 到 了 3- 立 方 体 连 
接 环 (3-CCC)。 如 图 A-6 所 示 。 


图 A-5 3- 立 方 体 
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图 A-6 3- 立 方 体 连接 环 


1.13 星 形 网 络 


星 形 网 络 以 一 个 节点 作为 中 心 节点 ， 并 与 所 有 其 他 节点 直接 连接 。 如 图 A-7 所 示 。 星 形 网 
络 的 直径 为 2， 这 与 节点 的 个 数 无 关 。 


图 A-7 星 形 网 络 
第 3 章 
3.4b) 我 们 给 由 n 个 处 理 器 所 组 成 的 每 个 组 分 配 一 个 数据 。i 组 得 到 A(i) 并 检查 A() 是 否 为 真 。 
如 果 A(i) 为 真 ， 那 么 对 于 所 有 的 j > i，A40) 为 假 。 只 有 最 小 下 标 对 应 的 4A() 仍 然 为 真 。 
算法 Smallest Index_CRCW 


输入 : 布尔 数组 A(1:n) 
输出 : 使 4(h) 为 真 的 最 小 下 标 k 
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1.Copy A(l:n) to B(1:n) 
2. Fori= 1 ton do in parallel 
3.1f B() = true then 
Forj=i+ 1 ton in parallel 
BO) = false 
End parallel 
4. End parallel 
S.Fori=1tok 
6. if a(i) = true 
return(k) 
7. End parallel 
8. END 


复杂 度 分 析 ”第 1 步 需要 O(n) 个 处 理 器 ， 执 行 时 间 为 0(1)。 第 2 ~ 4 步 需要 CO(2) 个 处 理 问 ， 
执行 时 间 为 0(1)。 第 5 ~ 7 步 需要 O(n) 个 处理 器 ， 执 行 时 间 为 0(1)。 第 3 步 中 的 B80) = false 需 要 
并 发 写 操作 。 因 此 该 算法 需要 用 CRCW PRAM 模 型 。 在 CRCW PRAM 模 型 中 ， 需 要 O(n) 个 处 
理 器 ， 执 行 时 间 为 O(1)。 

3.7 当 n = 16 时 ， 数 组 4(1:16) 被 分 成 log 7 个 组 。 


组 1 组 2 组 3 组 4 
A(1:4) A(S:8) A(9:12) A(13:16) 
在 每 一 组 内 ， 每 个 处 理 器 用 串 行 方式 求 最 小 值 ， 然 后 用 并 行 方式 求 。 如 图 A-8 所 示 。 
他 
四 Mn) 
(ve) Mr) on) 电 


@ 2 rp 四 由 站 


@ (8,) @ @ © @ @ @ 


图 A-8 数组 的 最 小 值 
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第 4 章 
4.3 假定 存在 一 个 数组 count(1:n)， 其 中 
Count(i) = 1, 4G() >X 
=0， 否 则 

现在 计算 Count 数 组 元 素 的 和 ， 就 得 到 A(1:n) 中 大 于 X 的 元 素 个 数 。 算 法 如 下 : 
算法 Greater Count 
输入 : A(1:n),X 
输出 : K = 大 于 X 的 元 素 个 数 

1. Fori= | ton do in parallel 

2.if A(?) >Xthen . 358 


count( = 1 


(LUD 
un 
ee] 


else 
count(i) = 0 
endif 
3. End parallel 
4. Find the sum of the count (1:n) array and store the values in 大 
5S. return k 
6. END 


复杂 度 分 析 ”第 1 ~ 3 步 需 要 O(n) 个 处 理 器 ， 执 行 时 间 为 0(1)。 第 4 步 是 求 和 算法 ， 因 此 
需要 O(n”) 个 处 理 器 ， 执 行 时 间 为 O(log n)。 这 样 ， 此 算法 需要 O(n 个 处 理 器 ， 执 行 时 间 为 
O(log n)。 

4.5 对 称 和 矩阵 算法 

输入 : A(l:n, 1:n) 

输出 : 4 是 否 为 对 称 年 阵 

1. Fori= 1 to n do in parallel 
2. For j= 1 to i do in parallel 
3. 1f A(iy) and AG,i) are not equal then conclude that A is not symmetric 
Abort the loop 
endif 
. End parallel 
. End parallel 


OQ Uh 上 


. Conclude that A is Symmetric if the loop was not aborted in step 3 359 
7. END 2 


复杂 度 分 析 该 算法 在 CRCW PRAM 模 型 下 ,需要 O(n) 个 处 理 器 ， 时 间 复 杂 度 为 0(1)。 
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索引 中 标注 的 页 码 为 英文 原 书 页 码 ， 与 书 中 边栏 的 页 码 一 致 。 


A 


Absolute speedup (绝对 加 速 比 )，52 
Algebraic equations (代数 方程 )，277 

Alpha (Alpha 处 理 器 )，4 

ALU (ALU)，3 

Arithmetic expression (算术 表达 式 )，160-162 
Arithmetic logic unit (算术 逻辑 单元 )，3 
Arrangement graph (排列 图 )，43 

Array (数组 }，59 

Array processor (阵列 处 理 器 }，16 
Articulation point ( 断 点 )，85 

Artificial intelligence ( 人工 智 能 ),，4 
Assignment statement (赋值 语句 )，45，46 
Associative memory processor ( 相 联 存储 处 理 器 ) ，27 
Asymptotic speed up( 渐 近 加 速 比 )，53 
Atoms (珠子 )，61 


B 


Backward substitution (向 后 消去 )，287 
Barrel shifter network (Barrel Shifter 网 络 )，57，354 
BC-tree (BC 树 )，88 
BFS (BFS), 83, 188 
Bi-clique ( 双 团 )，223 , 
Biconnected graph (2- 连 通 图 )，86 
Binary tree (二 叉 树 ) 
complete (完全 的 )，75 
definition (定义 )，29 
model (模型 )，74，108 
Binomial co-efficient (二 项 式 系 数 )，131 
Biconnected components ( 2- 连通 支 )，201 
Bi-partite graph (二 部 图 )，90 
Bisection method (对 分 法 }，278 
Block ( 块 )，87 
Block-cut vertex tree ( Block-cut 顶点 树 )，88 
Block graph ( 块 图 )，87 
Boolean AND (布尔 与 )，47-50 
Branch (分 枝 )}，103 
Branch weight (分 枝 权 重 )，103 


Breadth first search (广度 优先 搜索 )，83 
Bubble sort ( 冒 泡 排序 )，263 


C 


CDC-Cyber (CDC-Cyber), 15 

Center (中 心 }，72，103 

Central path (中 心路 )，103 

Centroid ( 形 心 )，103 

Chandra algorithm 《Chandra 算 法 )，216 
Character recognition (字符 识别 )，6 
Children (孩子 )，73 

Chord's method ( 粥 法 )，278 

Chordal ring network( 弦 环 网 络 )，58，353 
Chordal graph ( 续 图 )，94，213 
Chromatic number ( 色 数 )，92 

Chromatic polynomial ( 色 多 项 式 ) ，92，93 
Circle graph ( 轿 图 )，101 

Circuit integration ( 集成 电路 )，4 

Circuiar arc graph ( 圈 缴 图 )，101 

Circular list (循环 列表 ) ，64 
Circuit-Hamiltonian (哈密 顿 轿 )，71 

Clique ( 团 )，69，93 

Clique algorithm ( 团 算法 )，187 

Clique covering ( 团 禾 盖 )，93 

Coloring (染色 )，92 

Complete binary tree (完全 二 又 树 )，75 
Complete domination (完全 控制 )，105 
Component (分 支 )，68 

Computing time (计算 时 间 )，50 
Connected component (连通 支 )，68，191 
Connected graph (连通 图 )，71 
Connectivity (连通 度 )，85 

Connectivity algorithm (连通 度 算法 )，188 
Continuous list (连续 列表 )，63 
Contraction of tree 《( 树 收缩 )，155 

Control unit (控制 单元 )，3 

Core 《核心 )，103 

Cost normalized speed up (成 本 规范 化 加 速 比 )，53 
Crank Nickolson method (Crank Nickolson 法 ) ，347 








Cray XMP (Cray XMP), 4, 15 

CRCW (CRCW), 43 

CREW (CREW), 43 

Cube connected cycles (立方 体 连接 坏 )，355 
CV graph (CV 图 )，227 

Cycle ( 圈 )，66 


DAG (DAG), 29 

Data dependency (数据 相关 性 )，11 
Data structure (数据 结构 )，59 

DE graph (DE 图 ), 97 

Decomposability ( 可 分 解 性 )，11 
Definite integrals ( 定 积 分 )，326 

Degree ( 度 )，66 

Degree algorithms ( 度 算 法 )，184 

Depth first search 《深度 优先 搜索 ) ，83 
Descendents of a vertex ( 顶点 后 代 ) ，15S1 
Determinant (行列 式 )，278 

DFS (DFS), 83, 188, 191 

Diagonal matrix (对 角 和 矩阵 )，285 
Diameter ( 直径 )，72，175 

Differential equations (微分 方程 )，335 
Differentiation-partial ( 偏 微分 )，321 
Differentiation (微分 )，319-321 

Directed acyclic graph (有 向 无 环 图 )，29 
Distributed processing (分 布 式 处 理 )，14 
Divide and conquer (分 治 )，116 
Domatic number (domatic 数 ) ，105 
Dominating set (控制 集 )，104 

Doubly linked list (双向 链表 )，64 
Dufort Frankel method (Dufort Frankel 法 ),，349 
Duncan's taxonomy ( Duncan 分 类 )，25S 
DYV graph (DV 图 )，97 


E 


Eccentricity (离心 率 )，72 

Ed Roberts (Ed Roberts), 4 

Edge coloring ( 边 染 色 )，92 

Edge set ( 边 集 )，66 
Efficiency( 效 率 )，51，54 

Efficient domination (有 效 控制 )，105 
Elliptic equations ( 椭圆 方程 )，336 
Equations (方程 )，277 

ERCW (ERCW), 43 

EREW (EREW )，43 
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Erlangen (Erlangen), 20, 23 
Eta (Eta), 10, 15 
Euler ( 欧 拉 )， 
formula ( 欧 拉 公式 )，335 
graph ( 欧 拉 图 )，70 
graph algorithm ( 欧 拉 图 算法 )，186 
line ( 欧 拉 闭 迹 )，70， 
tour ( 欧 拉 环 游 )，145 
walk 〈 欧 拉 闭 迹 )，70 
Expert system (专家 系统 ), 6 


F 


False position ( 试 位 法 )，278 

Finite graph (有 限 图 )，66 

First generation computer (第 一 代 计 算 机 )，4 
Floyd-Warshall algorithm (Floyd-Warshall 算 法 )，209 
Flynn's classification (Flynn 分 类 )，20 
For-loop (For 循 环 )，46，47 

Forest (森林 ) ，78 

Forward substitution (向 前 消去 )，287 
Fourier tranforms 〈 傅 里 叶 变换 )，292 
Frontier (边界 ) ，97 

Fujitsu (富士 通 )，15 

Full binary tree( 满 二 又 树 )，75 

Furthest neighbors (最 远 邻 居 )，179 


G 


Gauss elimination (高 斯 消 元 法 )，287，312 
Gemoetric interpretation (几何 解释 ) ，277-278 
Giloi taxonomy (Giloi 分 类 )，24 
Givens rotation (Givens 旋转 )，289 
Graph (图 ) 
biconnected graph (2- 连 通 图 )，86 
bipartite (二 部 图 )，90 
chordal ( 续 图 )，94 
circle (图 图 )，101 
circular-arc ( 圆 弧 图 )，101 
connected (连通 图 ), 71 
distance hereditary (距离 遗传 图 )}，101 
Euler( 欧 拉 图 )，70 
Hamiltonian (哈密 顿 图 )，71 
interval (区 间 图 )，97 
k-connected (k- 连 通 图 )，87 
Kuratowski graphs ( 库 拉 托 斯 基 图 )，90 
mop ( 极 大 外 可 平面 图 )，92 
outerplanner ( 外 可 平面 图 )，92 
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planner (外 可 平面 图 )，88 
regular (正则 图 )，66 
separable 〈 可 分 离 图 )，86 
triconnected ( 3- 连通 图 )，87 
algorithms (图 算法 )，184 
unicursal (一 笔 图 ), 71 

Growing by doubling (二 倍增 长 )，112 


H 


Hajime Karatsu (Hajime Karatsu), 4 
Hamiltonian (哈密 顿 ) 

circuit (哈密 顿 图 )，71 

graph (哈密 顿 图 ) ，70，71 
Handler (Handier)，20，23 
Hazuhiro Fuchi (Hazuhiro Fuchi), 5 
Heapsort ( 堆 排 序 ) ，266-269 
Heat flow equation ( 热传导 方程 )，336，343 
Hideo Aiso (Hideo Aiso)，5 


High performance computer (高 性 能 计算 机 )，14 


Hitachi (人 (日立 )，15 
Homeomorphism ( 同 胚 )，69 
HP superchip (HP 超级 必 片 )，5 


Hwang-Brigg's taxonomy (Hwang-Brigg 分 类 )，24 


Hyperbolic equations ( 双 曲 方程 )，336 
Hypercube ( 超 立方 体 )，33 


IBM 3090/400/VF (IBM 3090/400/VF), 15 
ICOT (ICOT), 5 

If structure (lf 结构 }，46 

Iliac iv (Jlliac iv), 15 

Image processing (图 像 处 理 )，6-7 
Independent domination (独立 控制 )，105 
Independent set (独立 集 )，94 

Index (下 标 )，62 

Induced subgraph (诱导 子 图 )，68 
Infinite graph (无 限 图 )，66 

Infix (中 级 }，60 

Inherently sequential (内 在 串 行 )，13 
Initial value problem ( 初 值 问题 )，335 
Input unit (输入 单元 )，3 

Insertion sort (插入 排序 )，264-265 
Integrals ( 积分 )，326 

Integrals-definite ( 定 积分 )，326 

Intel (Intel), 5 


Intelligent machine ( 智能 机 器 )，6，9 
Interval graph (区 间 图 )，97 
Interpolation 
Lagrange's ( 拉 格 朗 日 插值 )，331 
linear (线性 插值 )，329 
quadratic (二 次 插值 )，330 
Intersection graph ( 交 图 )，94 
Inverse of matrix (矩阵 的 逆 )，305 
Isojated vertex (孤立 点 )，66 
Isomorphism ( 同 构 )，69 
Iyengar’s algorithm (Iyengar 算 法)，216 


K 


k-connected graph (〈 大 连通 图 )，87 
k-star graph (k- 星 形 图 )，41 

k-tree (k- 树 )，216 

k-cubes (大 立方 体 )，33 

Key board (键盘 )，3 

Koneigsberg bridge ( 哥 尼斯 堡 七 桥 )，70 
Kruskal's algorithm (Kruskal 算 法 )，204 
Kuratowski graphs ( 库 拉 托 斯 基 图 )，90 


L 


Laasonen method (Laasonen 法 )，344 
Lagrange's interpolation ( 拉 格 庚 日 插值 )，331 
Laplace equation ( 拉 普 拉 斯 方程 )，336 
Laplacian ( 拉 普 拉 斯 算 符 ) ，325 
LBFS (字典 顺序 广度 优先 搜索 )，96 
LCA (最 低 公 共 祖 先 )，151 
Left child ( 左 孩子 )，75 
Level number ( 层 数 )，73 
Level of a vertex (顶点 层 数 )，151 
Levels of parallelism (并 行 的 层次 )，18 
Linear equations (线性 方程 )，284 “ 
Linear interpolation (线性 插值 ) ，330 
Linked list (链接 列表 )，61 
List (列表 ) 

circular (循环 }，64 

doubly linked (双向 链接 )，64 

linked (链接 )，64 

list (列表 )}，59 

ranking (排序 )，113 
Loosely coupled ( 松 而 合 )，27 


Lowest common ancestor (最 低 公共 祖先 )，151-154 


M 


Magnetic disk (磁盘 )，3 





Magnetic tapes ( 磁带 )，3 
Manber Udi (Manber Udi), 102 
Matching (匹配 }，101 
Matrix ( 知 阵 ) 
inverse ( 道 先 阵 ) ，305 
multiplication (和 矩阵 乘法 )，124 
toeplitz (Toeplitz 佐 阵 )，308 
triangular ( 三 角形 矩阵 )}，306 
Maximum matching (最 大 匹配 )，101 
MCC (MCC), 96 
MCS (MCS), 96 
MEC (MEC), 96 
Median (重心 )，103 
Medical diagnosis (医疗 诊断 ), 6, 9 
Memory unit (存储 单元 )，3 
Mergesort (合并 排序 )，266-270 
Merging (合并 ) 
bitonic ( 双 调 ) ，258-260 
ranking ( 秩 合 并 )，255-257 
Mesh network (网 格 网 络 )，40 
Message broadcasting (消息 广播 })，57 
Metal oxide ( 金 虱 乌 化 物 )，5 
Micro processor ( 微 处 理 器 }，4 
MIMD (MIMD), 22 
Minimal dominating set ( 极 小 控制 集 )，105 
Minimal separator ( 极 小 分 离 集 )，86 
Minimum coloring (最 小 染色 )，92 
Minimum cost spanning tree (最 小 成 本 支撑 树 )，78 
Minimum dominating set (最 小 控制 集 )，105 
Mop graph《 极 大 外 可 平面 图 )，92 
Mostech (Mostech), 5 
Motorola (摩托 罗拉 ),，5 
MPP (MPP), 25 
Multi computer 《多 计算 机 )，14 
Mnulti processor (多 处 理 器 )，14 


N 


Naor algorithm (Naor 算 法 )，220 
NC algorithm (NC 算法 )，213 
Network (网 络 ) 

barrel shifter ( barrel shifter), 354 

chord ring ( 续 环 )}，353 

model (模型 )，32 

ring ( 环 网 络 ) ，352 

sorting (排序 )，270-272 

star ( 星 形 )，356 


索 引 1 261 





Newton-Raphson (牛顿 - 拉 弗 森 方法 )，278 
Non-planar graph (不 可 平面 图 )，90 
Null graph 〈 零 图 )，66 


-Nullity ( 零 维 数 )，78 


O 


Odd-even reduction method (奇偶 约 化 法 )，313-317 
Onuterplanar graph (外 可 平面 图 )，92 
Output unit (输出 单元 )，3 


P 


Paper tapes ( 纸 带 )，3 
Parabolic equation (抛物 方程 )，336，337 
Paradigms (环境 )，108 
Parallel computers (并 行 计算 机 )，10 
Parallel edge (平行 边 )，66 
Parent (双亲 ), 73, 75 
Parity graph (奇偶 图 )，101 
Partial differential equations ( 偏 微分 方程 )，321，336 
Partial sums ( 部 分 和 )，125 
Partitioning ( 划分) ，117 
Path (路 )，66 

length (路 长 )，76 

matching 《路 匹配 )，102 

root ( 根 )，165-168 

graph (路 图 )，97 

graph recognition (路 图 识别 )，228 
Pattern recognition (模式 识别 )，6-7 
PC (PC), 4 
Pendant vertex ( 基 挂 点 ) 66 
Pentium Pro (Pentium 聘 0),， 4 
PEO (PEO), 94 
PEPE (PEPE), 25 
Perfect coloring (正常 染色 )，92 
Perfect elimination scheme (完美 消去 格式 )，94 
Performance metrics (性 能 尺度 )，50 
Personal computer (个 人 计算 机 )，4 
Pipe lining (流水 线 )，13 
Pivotal condensation( 选 主 元 归 约 )，281 
Planar graph ( 可 平面 图 )，88 
Piotters (绘图 仪 )，3 
Pointer jumping (指针 跳 转 )，112 
Poisson equation 〈 泊 松 方程 )，336 
Polynomial multiplication ( 多项式 乘 法 ) ，302 
Post order numbering (后 序 编号 )，148 
Postfix (后 绎 )，60 
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PQ-tree (PQ 树 )，98 

PRAM (PRAM 模 型 )，43 

Prefix (前 毕 }，60 

Prefix minima (前 级 最 小 )，135 
Preorder numbering (前 序 编号 )，179 
Prim's algorithm (Prim 算 法 )，204 
Printer (打印 机 )，3 

Punched cards 〔 穿 孔 卡 片 )，3 
Pyramid network ( 金字塔 网 络 )，41 


Q 


Quadratic interpolation ( 本 次 插值 )，331 
Queue (队列 )，59 


Radius ( 半 答 )，72 

Rake operation (Rake 运 算 )，156 
Range minima (范围 内 最 小 值 问题 )，134 
Rank ( 秩 )，78 

Ranking ( 秩 ， 排 序 }，255-257 

RDE graph (有 根 有 问 边 路 图 )，97 
RDYV graph (有 根 有 阅 点 路 图 )，97 
Real speed up (实际 加 速 比 )，52 
Recognition algorithm ( 识别 算法 )，106 
Recognition of -tree (大 树 判 别 )，217 
Reduction machines (规约 机 )，28 
Region (区 域 )，90 

Regular falsi ( 试 位 法 )，278 

Regular graph ( 正则 图 )，66 

Relative speedup (相对 加 速 比 )，52 
Richardson’s formula (Richardsgn 公 式 )，348 
Right child ( 右 孩子 )，75 

Ring network( 环 状 网 )，57，352 
RISC (RISC), 15 

Root ( 根 )，73 

Root finding ( 求 根 )，162-165 

Rooted tree (有 根 树 )，73 
Rooting a tree (给 树 加 根 )，147 


S 


Scalability ( 可 扩展 性 )，55 
Scalar product (内 积 )，123 
Schaffer’s algorithm (Schaffer 算 法 )，220 
Schmidt method ( 施 密 特 法 )，338 
Searching (搜索 ) 

binary ( -分 )，251 


CREW PRAM (CREW PRAM 模 型 )，252 
more data (更 多 数据 )，253 
sequential ( 串 行 )，251 
unsorted 《未 排序 的 )，255 
Secant method ( 制 线 法 )，278 
Second generation computer (第 二 代 计 算 机 )，4 
Self edge ( 坏 )，66 
Separable graph (可 分 离 图 )，86 
Separator (分 离 集 )，86 
Sequential computer ( 串 行 计 算 机 )，10 
Shared memory model (共享 存储 器 模型 )，22 
Shell's sort ( Shell 排序 )，265 
Shifter network ( Shifter 网 络 ) ，354 
Shortest path problem (最 短路 问题 )，206 
Simple algorithm (简单 算法 )，47，123 
Simple graph (简单 图 }，66 
Simplicial vertex (单纯 顶点 )，94 
Simpson (辛普森 )，328 
Skewed binary tree ( 斜 二 叉 树 )，74 
Slater (Slater), 103 
Sollin's algorithm (Sollin 算 法 )，204 
Sorting (排序 )，262 
bubble (车 泡 )，263 
heap ( 堆 )，266-269 
insertion (插入 )}，264-265 
merge (合并 )，269-270 
sequential ( 串 行 )，262 
shell (shell), 265 
networks (网 络 )，270-272 
Spanning forest ( 支撑 森林 )，78 
Spanning tree (支撑 树 )，77，204 
Speech recognition (语音 识别 })，6，8 
Speed up (加 速 比 )，51 
asymptotic( 渐 近 加 速 比 )，53 
absolute (绝对 加 速 比 )，52 
real (实际 加 速 比 )，52 
relative (相对 加 速 比 )，52 
Stack (堆栈 )，59 
Star graph ( 星 形 图 )，41 
Star network ( 星 形 网 络 ) ，356 
STARAN (STARAN )，25 
STMD (STMD), 20 
STSD (STSD), 20 
Subgraph ( 子 图 )，68 
induced (诱导 子 图 )，68 
Subtree ( 子 树 )，73 
Successive approximation (逐次 逼近 法 )，278 





Suffix minima (后 级 最 小 )，135 
Summation ( 求 和 )，108 

Sun Wu (Sun Wu), 102 
Symmetric matrix (对 称 人 矩阵 )，359 
Synchronous (同步 )，25 

Systolic arrays (脉动 阵列 ) ，26 


T 


Taxonomy (分 类 )，20 
Taylor's series (泰勒 级 数 )，319 


Third generation computer (第 三 代 计算 机 )，4 


TI-ASC (TI-ASC), 15 

Tightly coupled ( 紧 耦 合 )，27 

Toeplitz matrix (Toeplitz 和 矩阵 ) ，308 
Tohru Moto Oka (Tohru Moto Oka), 4 
Topology of network (网 络 拓扑 )，32 


Transitive closure matrix (传递 闭 包 和 矩阵 )，196 


Trapezoidal ruie (梯形 法 则 )，327 
Tree ( 树 )，65，71 

algorithms ( 树 算法 ) ，145 

contraction 〈 树 收缩 )，155 

conversion ( 树 转化 ) ，168 

graph ( 树 图 )，83 

rooting ( 求 树 根 )，147 

rooted (有 根 树 )，73 
Triangular matrix (三 角形 人 矩阵 )，286，306 
Triconnected graph (3- 连 通 图 )，87 
Tridiagonal system (三 对 角 方程 组 )，311 


U 


Udi Manber (Udi Manber), 102 
UE graph (UE 图 ), 97 
Unicursal graph (一 笔 图 ),，71 
UV graph (UV 图 ), 97, 228 


V 


Vector processor (向量 处 理 器 )，26 
Vertex coloring (顶点 染色 )，92 

Vertex connectivity (顶点 连通 度 )，86 
Vertex expansion (顶点 扩展 )，100 
Vertex set (顶点 集 )，66 

VLSI (VLSI), 4 

Von-Mises formula (Von-Mises 公 式 )，278 
Von Neumann ( 汉 : 诺 依 曼 )，3 


W 


Walk (通道 )，66 

Warshall's algorithm (Warshall 算 法 )，209 
Wave equation (波动 方程 )，336 

Wether forecasting ( 天气 预报 )，6，8 
Weighted path length (加 权 路 径 长 度 )，76 
While-loop (While 循环 )，46 

Wu Sun (Wu Sun), 102 


Z 


ZMOB (ZMOB), 16 
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